Em 10 minutos, criei todo este vídeo musical para 'Smells Like Teen Spirit' do Nirvana usando AI. Aqui está o meu fluxo de trabalho completo e todos os prompts que usei 👇
A ferramenta principal utilizada foi o Veo 3 do Google. No entanto, primeiro, eu precisava acertar a linguagem para os prompts. Um prompt genérico como "vídeo musical do Nirvana" teria sido um desastre.
Então, usei (ChatGPT) GPT-4o como um parceiro de brainstorming para me ajudar a construir um vocabulário que capturasse a vibe grunge. PROMPT: "Forneça palavras-chave que definam a vibe grunge dos anos 90 do sucesso de 1991 'Smells Like Teen Spirit' do Nirvana, capturando a estética do videoclipe."
O ChatGPT elaborou uma lista de palavras-chave essenciais: - Gritty, estilo dos anos 90 - Filmagens de câmara de mão - Auditório lotado em Seattle - Corredor de escola secundária mal iluminado e sombrio - Energia distópica - Luzes de palco superexpostas
Com o meu vocabulário estético definido, comecei a gerar dezenas de clipes curtos no Veo 3. É como ser um diretor com um orçamento ilimitado para B-roll!
Para obter as principais filmagens do concerto, os prompts tinham que ser específicos sobre a energia e a localização. PROMPT: "Uma ampla tomada cinematográfica de uma banda de rock adolescente a tocar um espetáculo ao vivo de alta energia num auditório de uma escola secundária lotada em Seattle nos anos 90."
O vídeo precisava daquela perspectiva caótica, ao nível dos fãs. Um prompt de ponto de vista funcionou maravilhas aqui. PROMPT: "Uma tomada POV áspera, à altura dos ombros, de dentro da multidão, apontada para as luzes do palco desfocadas e superexpostas. Você vê apenas contornos da banda."
Para construir a "história" em torno do concerto, eu queria aquelas cenas clássicas e angustiantes de escola secundária. PROMPT: "Uma sequência rápida de cortes de câmera rápidos e sombrios através de um corredor de escola secundária mal iluminado dos anos 90, enquanto a câmera passa de um adolescente para o outro."
Às vezes, eu apenas pedi por pura estética para obter clipes que pudesse usar como transições ou texturas. PROMPT: "gerar um vídeo que seja inspirado pela música grunge de Seattle dos anos 1990 com um clima sombrio"
É aqui que a parte do humano no processo é tão importante. Agora eu tinha uma pasta cheia de clipes de 7 segundos. Importe tudo para um editor de vídeo simples chamado Capwing. A IA foi o cinegrafista, mas eu fui o diretor.
No Capwing, juntei os melhores clipes, sincronizando os cortes com a famosa dinâmica quieto-ALTO-quieto da música. Os planos caóticos e cheios de energia tinham que coincidir exatamente com o momento em que o refrão começava. É aqui que a narrativa e o bom gosto fazem toda a diferença.
Aqui está o que @clairevo (HOW I AI Podcast) disse:
A IA ainda não é perfeita, mas os artistas dos anos 60 e 70 enfrentaram restrições semelhantes com o equipamento de gravação. O que eu criei foi fan fiction, uma carta de amor aos meus sons favoritos dos anos 90. Mas a ideia é que agora temos as ferramentas para criar mídia original.
A distância entre a ideia e a execução nunca foi tão curta. As ferramentas estão aqui, são acessíveis e são incrivelmente poderosas. O meu conselho para todos é simples: vão brincar.
1,93K