热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
在10分钟内,我使用AI制作了这整个Nirvana的《Smells Like Teen Spirit》音乐视频。
这是我的完整工作流程和我使用的每个提示👇
使用的核心工具是谷歌的 Veo 3。
然而,首先,我需要确定提示的语言。像 "涅槃音乐视频" 这样的通用提示将会是一场灾难。

所以,我使用了(ChatGPT)GPT-4o作为头脑风暴伙伴,帮助我建立一个能够捕捉到颓废氛围的词汇。
提示:"提供定义1991年Nirvana热门歌曲《Smells Like Teen Spirit》的90年代颓废氛围的关键词,捕捉音乐视频的美学。"
ChatGPT 提出了一个重要关键词列表:
- 粗犷的,90年代风格
- 手持摄像机拍摄的画面
- 拥挤的西雅图礼堂
- 情绪化、昏暗的高中走廊
- 反乌托邦的能量
- 过度曝光的舞台灯光
在我设定了美学词汇后,我开始在Veo 3中生成数十个短片。
这就像是一个拥有无限B-roll预算的导演!
为了获得主要的音乐会录像,提示必须具体说明能量和地点。
提示:"一幅宽广的电影镜头,展示一支青少年摇滚乐队在1990年代的西雅图一所拥挤的高中礼堂中进行高能量现场演出。"
这个视频需要那种混乱的、粉丝级别的视角。一个视角提示在这里发挥了奇妙的作用。
提示:"一个从人群中拍摄的、肩膀高度的粗糙视角,指向模糊、过曝的舞台灯光。你只能看到乐队的轮廓。"
为了构建关于音乐会的“故事”,我想要那些经典的、充满焦虑的高中场景。
提示:"快速切换的镜头在昏暗的1990年代高中走廊中穿梭,镜头从一个青少年切换到下一个。"
有时我只是为了纯粹的美学而提示,以获取我可以用作过渡或纹理的剪辑。
提示:"生成一个受1990年代西雅图垃圾音乐启发、带有黑暗氛围的视频"
这就是人机协作部分如此重要的地方。
我现在有一个装满7秒视频片段的文件夹。我将所有内容导入了一个叫Capwing的简单视频编辑器。
AI是摄影师,但我是导演。
在 Capwing 中,我将最佳片段拼接在一起,将剪辑与歌曲著名的安静-响亮-安静的动态同步。
混乱而充满活力的镜头必须在合唱部分到来时恰到好处。这就是叙事和品味产生巨大差异的地方。
这是 @clairevo (HOW I AI Podcast) 说的内容:
AI 还不完美,但在 60 年代和 70 年代,艺术家们也面临着类似的录音设备限制。
我创作的是粉丝小说,是我对 90 年代最喜欢的声音的情书。但关键在于,我们现在拥有创造原创媒体的工具。
从想法到执行的距离从未如此之短。
工具已经到位,它们触手可及,而且功能强大。我给每个人的建议很简单:去玩吧。
1.94K
热门
排行
收藏