Miło widzieć kolejny w pełni otwarty, multimodalny model językowy! Dobra licencja, kod treningowy, dane do wstępnego treningu, wszystko tutaj. LLaVA-OneVision-1.5: W pełni otwarta struktura dla zdemokratyzowanego treningu multimodalnego Powoli społeczność się rozwija.