🚨 A DeepMind finalmente lançou o artigo Veo3, que mostra o que todos nós percebemos ao brincar com modelos de vídeo-gen. Assim como os LLMs, o raciocínio visual é uma propriedade emergente do treinamento em toneladas de vídeo. Ele pode resolver tarefas que não estão explicitamente nos dados de treinamento. "O Veo 3 é o momento GPT-3 para o raciocínio visual"
Fonte:
236,09K