VideoFrom3D : Révolutionner la génération de vidéos de scènes 3D !
Ce cadre combine des modèles de diffusion d'images et de vidéos pour créer des vidéos photoréalistes et stylistiquement cohérentes à partir de géométrie grossière, de chemins de caméra et d'images de référence. Aucun ensemble de données 3D appariées n'est nécessaire, simplifiant ainsi la conception graphique 3D.
AutoIntent : AutoML de bout en bout de DeepPavlov pour la classification de texte
Automatise la sélection d'embeddings, l'optimisation des classificateurs et le réglage des seuils pour des résultats SOTA en classification d'intentions. Dispose d'une API simple, semblable à sklearn, pour la détection multi-label et hors champ.
Alibaba Group et ses partenaires dévoilent MMR1 : Révolutionner le raisonnement multimodal avec moins de données !
MMR1 introduit l'échantillonnage sensible à la variance (VAS) pour un ajustement stable du RL. S'attaque à l'optimisation instable et aux données de haute qualité rares. Publication de vastes ensembles de données ouverts (~1,6M CoT, 15k RL QA) et de modèles (3B, 7B, 32B) pour la communauté.