En 10 minutes, j'ai créé cette vidéo musicale entière pour 'Smells Like Teen Spirit' de Nirvana en utilisant l'IA. Voici mon flux de travail complet et chaque prompt que j'ai utilisé 👇
L'outil principal utilisé était le Veo 3 de Google. Cependant, d'abord, je devais maîtriser la langue pour les invites. Une invite générique comme "vidéo musicale de Nirvana" aurait été un désastre.
Donc, j'ai utilisé (ChatGPT) GPT-4o comme partenaire de brainstorming pour m'aider à construire un vocabulaire qui capturerait l'ambiance grunge. PROMPT : "Fournissez des mots-clés qui définissent l'ambiance grunge des années 90 du succès de 1991 'Smells Like Teen Spirit' de Nirvana, capturant l'esthétique du clip vidéo."
ChatGPT a proposé une liste de mots-clés essentiels : - Rugueux, style des années 1990 - Images de caméscope portable - Auditorium de Seattle bondé - Couloir de lycée sombre et faiblement éclairé - Énergie dystopique - Lumières de scène surexposées
Avec mon vocabulaire esthétique en place, j'ai commencé à générer des dizaines de courts clips dans Veo 3. C'est comme être un réalisateur avec un budget illimité pour les séquences B-roll !
Pour obtenir les principales séquences de concert, les instructions devaient être spécifiques concernant l'énergie et l'emplacement. INSTRUCTION : "Un plan large et cinématographique d'un groupe de rock adolescent jouant un concert live énergique dans un auditorium d'un lycée de Seattle bondé dans les années 1990."
La vidéo avait besoin de cette perspective chaotique, au niveau des fans. Un prompt de point de vue a fait des merveilles ici. PROMPT : "Un plan POV granuleux, à hauteur d'épaule, depuis la foule, pointé vers les lumières de scène floues et surexposées. Vous ne voyez que des silhouettes du groupe."
Pour construire l'"histoire" autour du concert, je voulais ces scènes classiques et angoissées de lycée. PROMPT : "Une séquence rapide de coupes de caméra rapides et sombres à travers un couloir de lycée faiblement éclairé des années 1990, alors que la caméra passe d'un adolescent à l'autre."
Parfois, je demande juste pour des raisons esthétiques afin d'obtenir des clips que je pourrais utiliser comme transitions ou textures. PROMPT : "générer une vidéo inspirée par la musique grunge de Seattle des années 1990 avec une ambiance sombre"
C'est ici que la partie humaine est si importante. J'avais maintenant un dossier plein de clips de 7 secondes. J'ai tout importé dans un simple éditeur vidéo appelé Capwing. L'IA était le directeur de la photographie, mais j'étais le réalisateur.
Dans Capwing, j'ai assemblé les meilleurs extraits, synchronisant les coupes avec la célèbre dynamique calme-LOUD-calme de la chanson. Les plans chaotiques et énergiques devaient arriver au bon moment lorsque le refrain commençait. C'est ici que la narration et le goût font toute la différence.
Voici ce que @clairevo (podcast HOW I AI) a dit :
L'IA n'est pas encore parfaite, mais les artistes des années 60 et 70 faisaient face à des contraintes similaires avec l'équipement d'enregistrement. Ce que j'ai créé était de la fan fiction, une lettre d'amour à mes sons préférés des années 90. Mais l'idée est que nous avons maintenant les outils pour créer des médias originaux.
La distance entre l'idée et l'exécution n'a jamais été aussi courte. Les outils sont là, ils sont accessibles et ils sont incroyablement puissants. Mon conseil à tout le monde est simple : allez jouer.
1,93K