VideoFrom3D: Rewolucjonizowanie generacji wideo ze scen 3D!
Ten framework łączy modele dyfuzji obrazów i wideo, aby tworzyć fotorealistyczne, spójne stylistycznie filmy z grubej geometrii, ścieżek kamery i obrazów referencyjnych. Nie są potrzebne sparowane zbiory danych 3D, co upraszcza projektowanie grafiki 3D.
AutoIntent: End-to-End AutoML DeepPavlov do klasyfikacji tekstu
Automatyzuje wybór osadzeń, optymalizację klasyfikatora i dostosowywanie progów dla wyników SOTA w klasyfikacji intencji. Oferuje prosty interfejs API przypominający sklearn do wykrywania wielu etykiet i poza zakresem.
Grupa Alibaba i partnerzy ujawniają MMR1: Rewolucjonizując multimodalne rozumowanie przy mniejszej ilości danych!
MMR1 wprowadza próbkowanie uwzględniające wariancję (VAS) do stabilnego dostrajania RL. Radzi sobie z niestabilną optymalizacją i niedoborem wysokiej jakości danych. Udostępnia ogromne otwarte zbiory danych (~1,6M CoT, 15k RL QA) i modele (3B, 7B, 32B) dla społeczności.