Veo 3.1 提示词指南:掌握AI视频生成的专业技巧

Veo 3.1 提示词指南:掌握AI视频生成的专业技巧
Veo 3.1是Google最先进的AI视频生成模型,能够制作1080p的电影级视频,并配有同步音频、对话和音效。但输出质量完全取决于你如何编写提示词。经过大量测试,AI Video Lab团队编写了这份全面的Veo 3.1提示词指南,涵盖从基础结构到高级电影技巧的所有内容。
- 每个提示词都要包含五个核心要素:主体、动作、场景、风格和音频
- 使用电影术语(镜头角度、镜头类型、灯光)获得专业级输出
- 镜头指令要简单,避免叠加冲突的运动
- 在引号中添加对话,明确描述音效以生成原生音频
- 从4秒720p片段开始迭代,提示词完善后再扩大规模
立即试用Veo 3.1提示词
立即将这些提示词技巧付诸实践。新用户获得免费积分开始生成视频。
每个有效的Veo 3.1提示词都应该包含五个核心维度,它们共同构建视频的空间-时间逻辑。将这些视为模型用来准确理解你想要什么的构建块。
| 要素 | 控制内容 | 示例 |
|---|---|---|
| 主体 | 画面中出现的人或物 | "一位30多岁穿着柔软毛衣的女性" |
| 动作 | 主体做什么 | "喝第一口咖啡" |
| 场景 | 环境、时间、天气 | "俯瞰安静城市街道的小阳台,黎明时分" |
| 风格 | 视觉美学和情绪 | "温馨生活美学,浅景深" |
| 音频 | 对话、声音、音乐 | "鸟儿轻柔啁啾,远处城市嗡嗡声" |
这是一个结合所有五个要素的示例:
一位30多岁的女性在俯瞰安静城市街道的小阳台上喝第一口咖啡的特写镜头。裹着柔软毛衣,晨光轻抚她的脸庞。背景中鸟儿轻柔啁啾。电视广告风格,温暖色调。
关键洞察是Veo 3.1会整体解读你的提示词。你包含(或遗漏)的每个元素都会影响最终输出。
镜头术语是Veo 3.1真正出色的地方。该模型对电影语言有卓越的理解,指定焦距、角度和运动轨迹会显著改善你的结果,远超通用提示词。
| 镜头类型 | 使用时机 | 提示词关键字 |
|---|---|---|
| 全景镜头 | 建立场景、风景 | "wide shot", "establishing shot" |
| 中景镜头 | 对话、一般动作 | "medium shot", "waist-up" |
| 特写镜头 | 情感、产品细节 | "close-up", "tight shot" |
| 大特写 | 纹理、微观细节 | "macro shot", "extreme close-up" |
| 主观镜头 | 沉浸式、第一人称 | "POV shot", "first-person view" |
Veo 3.1在跟随清晰、简单的镜头动作方面远胜于叠加、冲突的指令。每个提示词使用一个主要镜头运动以获得最佳效果。
- 推拉镜头(Dolly in / Dolly out) - 镜头向主体靠近或远离。适合营造紧张感或揭示背景。
- 摇镜头(Pan shot) - 镜头水平旋转。用于扫描环境或跟随横向运动。
- 跟拍镜头(Tracking shot) - 镜头跟随主体。创造沉浸感和观众连接。
- 摇臂镜头(Crane shot) - 镜头垂直上升或下降。适合史诗级揭示。
- 推拉变焦(Dolly zoom/Vertigo effect) - 推拉镜头的同时反向变焦。创造戏剧性迷失感。
这是一个展示有效镜头运动的提示词:
摇臂镜头从站在巨大峡谷边缘的孤独徒步者低机位开始,然后升高到高空,展现日出时薄雾弥漫的巨大峡谷。轻风逐渐变成宏伟管弦乐随着镜头上升。
添加镜头术语让你控制景深和视觉感受:
- "浅景深" - 模糊背景,突出主体
- "虚化" - 创造柔和的圆形背景模糊
- "焦点切换" - 在单个镜头内在主体间切换焦点
- "广角镜头" - 扩大视野,添加轻微畸变
- "微距镜头" - 极端特写,窄焦点平面
- "35mm胶片" - 添加有机颗粒和电影温暖感
Veo 3.1的突出特点之一是原生音频生成。该模型可以产生同步对话、音效和环境音频——但只有在你明确提示时才会生成。
在提示词中用引号包含角色对话。明确描述语调和表达方式:
昏暗办公室中坐在桌后的侦探中景镜头。他抬头用疲惫的声音说:"Of all the offices in this town, you had to walk into mine."黑色电影美学,戏剧性阴影。
对话提示词技巧:
- 描述声音特质("疲惫的声音"、"兴奋的耳语"、"平静单调")
- 保持对话简短——一两句话效果最佳
- 让对话语调与视觉风格匹配
明确描述声音并将其与可见动作连接:
狭窄小巷在脉动霓虹招牌下发光,冷雨飘洒的全景镜头。远处警报声响起,霓虹轻柔嗡嗡声,静电噼啪声,电流嗡鸣在雨声下脉动。
设置与场景匹配的音频环境:
雪夜中的孤独小屋。风在松树间呼啸,屋内火焰噼啪声,偶尔木梁吱嘎声。舒适孤立的情绪。
生成带音频的视频
Veo 3.1生成同步音频、对话和音效。用你自己的提示词试试看。
Veo 3.1对艺术指导反应良好。你可以通过类型参考、调色描述和电影技术术语来引导视觉风格。
| 类型 | 使用关键词 |
|---|---|
| 电影 | "cinematic", "shot on 35mm film", "anamorphic lens" |
| 纪录片 | "documentary style", "handheld camera", "natural lighting" |
| 恐怖 | "desaturated colors", "heavy grain", "low-angle", "flickering light" |
| 科幻 | "neon-lit", "futuristic", "holographic", "cyberpunk atmosphere" |
| 广告 | "TV commercial style", "clean aesthetic", "professional lighting" |
| 动漫 | "Japanese anime style", "cel-shaded", "vibrant colors" |
明确描述你想要的效果:
- 调色:"cyan-magenta color grading"、"warm golden tones"、"muted pastel palette"
- 光线方向:"dramatic side lighting"、"overhead natural light"、"backlit silhouette"
- 时间:"golden hour"、"blue hour"、"harsh midday sun"、"overcast diffused light"
这是一个结合风格元素的示例:
雨中侦探穿长大衣站在黑暗小巷闪烁霓虹招牌下的中景镜头。他点燃香烟,火焰短暂照亮他饱经风霜的脸庞。冷雨持续飘洒。黑色电影美学,青洋红调色。
Veo 3.1每次生成支持最多三张参考图像。这对于在多个片段中保持角色和场景一致性至关重要。你可以使用参考图像来:
- 在不同镜头中锁定角色外观
- 保持一致的环境或位置
- 保留特定物体细节(产品、道具、服装)
当结合参考图像和文本提示词时,文本引导动作和镜头,图像引导视觉身份。
Veo 3.1的首末帧功能让你精确定义镜头的开始和结束。然后模型在两帧之间生成自然运动。这对以下情况特别有效:
- 平滑变换序列
- 两个特定构图间的受控镜头运动
- 具有精确开始和结束状态的场景过渡
你可以指定生成中要避免的元素。编写负面提示词时,描述你想排除的内容,不使用"不要"或"禁止"等词:
- "避免水印、文字覆盖、字幕"
- "排除镜头光晕、过曝、运动模糊"
这些是经过测试的提示词,你可以立即复制、修改和使用Veo 3.1。
山崖边岩石上时尚智能手表的特写镜头。镜头从近距离开始然后平滑连续的无人机镜头拉远。随着上升,广阔的高山景观展开。产品广告风格,戏剧性自然光照。
现代会议厅讲台前自信演讲者的中景镜头。她自然手势同时说道:"The future of AI is not about replacement -- it is about collaboration."柔和舞台灯光,专业企业美学。
黄昏时密林中独狼在新雪中移动的全景跟拍镜头。侧面跟拍镜头。爪下雪花嘎吱声,风在松树间低语。纪录片风格,自然光照,35mm胶片颗粒。
医院长空走廊尽头孤独身影的低角度全景镜头,荧光灯闪烁。身影缓慢走向镜头,脚步声回响。去饱和色彩,重颗粒,恐怖美学。
摩托车头盔摄像头沿蜿蜒海岸公路疾驰的主观镜头。镜头倾斜进入弯道显示悬崖边和下方海洋。黄金时刻光照带太阳光晕。高能量运动风格。
厨师双手在大理石台面上精心摆放新鲜食材的中景镜头,工作专注。镜头向上倾斜露出厨师专注表情。顶部自然光,温馨生活美学。
模特穿着飘逸丝裙走过空旷艺术画廊的慢推镜头。每一步都让面料产生微妙波纹。柔和散射画廊灯光,高端时尚编辑风格。
秋日午后温暖阳光透过树林,老人在公园长椅上喂鸽子的中景镜头。他停顿,抬头带着温和微笑,叶子飘过。情感怀旧色调,浅景深。
双手与透明全息显示器交互特写,滑动和捏合操作3D数据可视化。蓝白界面光辉照亮面部。未来主义科幻美学,简洁设计。
反射黑色表面上奢华香水瓶的微距特写,戏剧性聚光灯创造金色高光。瓶子缓慢旋转露出优雅设计细节。高端商业美学。
最有效的Veo 3.1工作流遵循结构化迭代过程。
从4秒720p分辨率的简短清晰提示词开始。这让你以最小成本快速测试。
女性雨夜走过城市街道的全景镜头。
一旦基础生成看起来正确,加入镜头、灯光和风格细节:
穿红大衣女性雨夜走过城市街道的全景镜头。街对面跟拍镜头。湿润路面霓虹倒影,忧郁青橙调色。
添加声音设计为场景注入生命:
穿红大衣女性雨夜走过城市街道的全景镜头。街对面跟拍镜头。湿润路面霓虹倒影,忧郁青橙调色。雨点敲击混凝土,远处交通嗡嗡声,她的高跟鞋有节奏敲击。
当提示词提供一致结果时,增加到8秒1080p获得最终输出。使用Veo 3.1标准版本获得制作级质量结果,或快速版本继续迭代。
- 迭代间一次改变一个变量(镜头或灯光,不要同时改变)
- 动作密集场景使用更短时长(4-6秒)
- 多次运行同一提示词——每次生成产生略微不同结果
- 使用种子参数探索效果好的提示词变体
开始使用Veo 3.1生成
在浏览器中直接使用Veo 3.1应用这些提示词技巧。新用户有免费积分。
| 错误 | 失败原因 | 解决方案 |
|---|---|---|
| 叠加多个镜头运动 | 冲突指令混淆模型 | 每个提示词一个主要镜头运动 |
| 模糊主体描述 | 模型填入随机细节 | 明确外观、服装、年龄 |
| 忽略音频 | 错失Veo 3.1最佳特性之一 | 总是包含音频指导 |
| 提示词过长 | 关键细节被稀释 | 保持提示词聚焦和结构化 |
| 跳过迭代 | 第一次尝试很少完美 | 从简单开始,逐步精炼 |
| 相关片段风格不一致 | 破坏视觉连续性 | 在相关提示词间重复使用色调和风格描述符 |
编写有效的Veo 3.1提示词是一项可学习的技能。五要素公式(主体、动作、场景、风格、音频)为你提供可靠的起始框架,而镜头控制、镜头效果和灯光的电影术语则解锁专业级输出。从简单开始,系统性迭代,利用Veo 3.1的原生音频生成创造真正出众的视频。
掌握这些技巧的最佳方法是实践操作。每个提示词都会教你一些关于模型如何解释你指令的知识。
AI Video Lab
AI video generation expert and content creator.