Honestamente, no estoy seguro de cómo esto se me escapó hace unas semanas. Esto es imagen a video con enfoque en la sincronización de labios y la animación facial. Una foto + grabación de voz de 10 segundos to producir estos cabezas parlantes.