За 10 хвилин я створив весь цей кліп на пісню Nirvana «Smells Like Teen Spirit» за допомогою штучного інтелекту. Ось мій повний робочий процес і всі підказки, які я використовував 👇
Основним використовуваним інструментом був Veo 3 від Google. Однак спочатку мені потрібно було прибити мову для підказок. Загальна підказка на кшталт «музичний кліп Nirvana» була б катастрофою.
Отже, я використовував (ChatGPT) GPT-4o як партнера для мозкового штурму, щоб допомогти мені створити словник, який би передавав атмосферу гранжу. PROMPT: "Надайте ключові слова, які визначають атмосферу гранжу 90-х у хіті 1991 року "Smells Like Teen Spirit" гурту Nirvana, відображаючи естетику музичного відео."
ChatGPT склав список обов'язкових ключових слів: -Суворий, у стилі 1990-х - Кадри з ручної відеокамери -Переповнена глядацька зала в Сіетлі -Похмурий, тьмяно освітлений коридор середньої школи -Антиутопічна енергія -Пересвічені сценічні світильники
Маючи набір естетичного словника, я почав генерувати десятки коротких роликів у Veo 3. Це все одно, що бути режисером з необмеженим бюджетом на B-roll!
Щоб отримати основні кадри концерту, підказки мали бути конкретними щодо енергії та локації. ПІДКАЗКА: «Широкий, кінематографічний кадр підліткового рок-гурту, який грає енергійне живе шоу в переповненій аудиторії середньої школи Сіетла в 1990-х роках».
Відео потребувало цієї хаотичної перспективи на рівні фанатів. Підказка з точки зору творила тут чудеса. ПІДКАЗКА: «Піщаний, висотою до плечей, кадр POV пролунав зсередини натовпу, спрямований на розмите, переекспоноване світло сцени. Ви бачите лише обриси гурту».
Щоб побудувати «історію» навколо концерту, я хотів цих класичних, гнівних сцен у середній школі. ПІДКАЗКА: «Швидка та похмура камера прорізає тьмяно освітлений коридор середньої школи 1990-х років, коли камера переходить від одного підлітка до іншого».
Іноді я просто просив про чисту естетику, щоб отримати кліпи, які я міг би використовувати як переходи або текстури. ПІДКАЗКА: "створіть відео, натхненне сіетлською гранжовою музикою 1990-х років із похмурим настроєм"
Саме тут так важлива частина «людина в петлі». Тепер у мене була папка, повна 7-секундних кліпів. Я імпортував все в простий відеоредактор під назвою Capwing. Штучний інтелект був оператором, а я – режисером.
У Capwing я зшив найкращі кліпи разом, синхронізувавши нарізки зі знаменитою тихо-ГУЧНО-тихою динамікою пісні. Хаотичні, енергійні постріли повинні були приземлитися саме тоді, коли вдарив хор. Ось де розповідь і смак мають вирішальне значення.
Ось що сказав @clairevo (How i ai Podcast):
Штучний інтелект ще не ідеальний, але артисти 60-х і 70-х років зіткнулися з подібними обмеженнями з обладнанням для звукозапису. Те, що я створила, було фанфіком, любовним листом до моїх улюблених звуків 90-х. Але ідея полягає в тому, що тепер у нас є інструменти для створення оригінальних медіа.
Відстань між ідеєю та виконанням ще ніколи не була такою короткою. Інструменти тут, вони доступні, і вони неймовірно потужні. Моя порада всім проста: ідіть грати.
1,94K