Za 10 minut jsem vytvořil celé toto hudební video pro Nirvanu 'Smells Like Teen Spirit' pomocí umělé inteligence. Zde je celý můj pracovní postup a každá výzva, kterou jsem použil 👇
Základním použitým nástrojem bylo Veo 3 od Googlu. Nejprve jsem však potřeboval vyladit jazyk pro výzvy. Obecná výzva jako "hudební video Nirvany" by byla katastrofa.
Použil jsem tedy (ChatGPT) GPT-4o jako partnera pro brainstorming, který mi pomohl vytvořit slovní zásobu, která by zachytila atmosféru grunge. VÝZVA: "Poskytněte klíčová slova, která definují atmosféru grunge 90. let hitu 'Smells Like Teen Spirit' z roku 1991 od Nirvany, zachycující estetiku hudebního videa."
ChatGPT přišel se seznamem základních klíčových slov: -Drsný, ve stylu 90. let -Záběry z ruční videokamery - Zaplněné hlediště v Seattlu -Náladová, spoře osvětlená chodba střední školy -Dystopická energie -Přeexponovaná jevištní světla
Se svou sadou estetického slovníku jsem začal ve Veo 3 generovat desítky krátkých klipů. Je to jako být režisérem s neomezeným rozpočtem na béčko!
Aby bylo možné získat hlavní záběry z koncertu, musely být nápovědy konkrétní ohledně energie a místa. NÁPOVĚDA: "Široký, filmový záběr na teenagerskou rockovou kapelu, která v 90. letech hrála energickou živou show v přeplněné posluchárně střední školy v Seattlu."
Video potřebovalo tu chaotickou perspektivu na úrovni fanoušků. Výzva k zadání stanoviska zde udělala zázraky. VÝZVA: "Drsný POV záběr ve výši ramen z davu, který mířil na rozmazaná, přeexponovaná světla na pódiu. Vidíte jen obrysy kapely."
Abych vystavěl "příběh" kolem koncertu, chtěl jsem ty klasické, úzkostlivé středoškolské scény. NÁPOVĚDA: "Rychlá sekvence rychlé, náladové kamery protíná spoře osvětlenou chodbu střední školy z 90. let, jak kamera přejíždí od jednoho teenagera k druhému."
Někdy jsem prostě požádal o čistou estetiku, abych získal klipy, které bych mohl použít jako přechody nebo texturu. VÝZVA: "vygenerujte video, které je inspirováno grungeovou hudbou ze Seattlu 90. let s temnou náladou"
To je místo, kde je část "člověk ve smyčce" tak důležitá. Nyní jsem měl složku plnou 7sekundových klipů. Vše jsem importoval do jednoduchého video editoru s názvem Capwing. AI byl kameraman, ale já jsem byl režisér.
V Capwing jsem spojil ty nejlepší klipy dohromady a synchronizoval střihy se slavnou dynamikou písně quiet-LOUD-quiet. Chaotické, vysoce energetické střely musely dopadnout přesně ve chvíli, kdy udeřil refrén. A právě zde hraje roli vyprávění příběhů a vkusu.
Zde je to, co řekl @clairevo (podcast How I AI):
Umělá inteligence ještě není dokonalá, ale umělci v 60. a 70. letech čelili podobným omezením s nahrávacím zařízením. To, co jsem vytvořila, byla fanfikce, milostný dopis mým oblíbeným zvukům 90. let. Ale myšlenka je taková, že nyní máme nástroje k vytváření originálních médií.
Vzdálenost mezi nápadem a realizací nebyla nikdy kratší. Nástroje jsou zde, jsou dostupné a jsou neuvěřitelně výkonné. Moje rada pro všechny je jednoduchá: jděte si hrát.
1,94K