Erster Test mit Bytedance's Omnihuman v1.5 über @FAL Eingabe war ein einzelnes Standbild und eine Audiodatei - kein Videoeingang. Erster Eindruck: Angesichts dessen, dass dies alles aus einem einzigen Standbild stammt, ist die Interaktion mit der Szene (siehe ihn, wie er hier das Papier handhabt) beeindruckend, macht die Dinge viel weniger statisch. Das hat eine Weile gedauert, um zu generieren, aber ich kann die Ergebnisse nicht bestreiten!