正直なところ、数週間前にどうやってこれが私の注意を逃れたのかわかりません。 これは、リップシンクと顔のアニメーションに焦点を当てた画像からビデオへの変換です。 写真1枚+10秒の音声録音 これらのトーキングヘッドを生み出します。