English 简体中文繁體中文日本語 한국어 Русский Español Italiano

Tutorial

Veo 3.1 提示詞指南：掌握AI影片生成的專業技巧

AI Video Lab發佈於 2026年3月11日17 分鐘閱讀

Veo 3.1 提示詞指南：掌握AI影片生成的專業技巧

Veo 3.1是Google最先進的AI影片生成模型，能夠製作1080p的電影級影片，並配有同步音訊、對話和音效。但輸出質量完全取決於你如何編寫提示詞。經過大量測試，AI Video Lab團隊編寫了這份全面的Veo 3.1提示詞指南，涵蓋從基礎結構到高階電影技巧的所有內容。

每個提示詞都要包含五個核心要素：主體、動作、場景、風格和音訊
使用電影術語（鏡頭角度、鏡頭型別、燈光）獲得專業級輸出
鏡頭指令要簡單，避免疊加衝突的運動
在引號中新增對話，明確描述音效以生成原生音訊
從4秒720p片段開始迭代，提示詞完善後再擴大規模

立即試用Veo 3.1提示詞

立即將這些提示詞技巧付諸實踐。新使用者獲得免費積分開始生成影片。

開始創作

每個有效的Veo 3.1提示詞都應該包含五個核心維度，它們共同構建影片的空間-時間邏輯。將這些視為模型用來準確理解你想要什麼的構建塊。

要素	控制內容	示例
主體	畫面中出現的人或物	"一位30多歲穿著柔軟毛衣的女性"
動作	主體做什麼	"喝第一口咖啡"
場景	環境、時間、天氣	"俯瞰安靜城市街道的小陽臺，黎明時分"
風格	視覺美學和情緒	"溫馨生活美學，淺景深"
音訊	對話、聲音、音樂	"鳥兒輕柔啁啾，遠處城市嗡嗡聲"

這是一個結合所有五個要素的示例：

一位30多歲的女性在俯瞰安靜城市街道的小陽臺上喝第一口咖啡的特寫鏡頭。裹著柔軟毛衣，晨光輕撫她的臉龐。背景中鳥兒輕柔啁啾。電視廣告風格，溫暖色調。

關鍵洞察是Veo 3.1會整體解讀你的提示詞。你包含（或遺漏）的每個元素都會影響最終輸出。

鏡頭術語是Veo 3.1真正出色的地方。該模型對電影語言有卓越的理解，指定焦距、角度和運動軌跡會顯著改善你的結果，遠超通用提示詞。

鏡頭型別	使用時機	提示詞關鍵字
全景鏡頭	建立場景、風景	"wide shot", "establishing shot"
中景鏡頭	對話、一般動作	"medium shot", "waist-up"
特寫鏡頭	情感、產品細節	"close-up", "tight shot"
大特寫	紋理、微觀細節	"macro shot", "extreme close-up"
主觀鏡頭	沉浸式、第一人稱	"POV shot", "first-person view"

Veo 3.1在跟隨清晰、簡單的鏡頭動作方面遠勝於疊加、衝突的指令。每個提示詞使用一個主要鏡頭運動以獲得最佳效果。

推拉鏡頭（Dolly in / Dolly out） - 鏡頭向主體靠近或遠離。適合營造緊張感或揭示背景。
搖鏡頭（Pan shot） - 鏡頭水平旋轉。用於掃描環境或跟隨橫向運動。
跟拍鏡頭（Tracking shot） - 鏡頭跟隨主體。創造沉浸感和觀眾連線。
搖臂鏡頭（Crane shot） - 鏡頭垂直上升或下降。適合史詩級揭示。
推拉變焦（Dolly zoom/Vertigo effect） - 推拉鏡頭的同時反向變焦。創造戲劇性迷失感。

這是一個展示有效鏡頭運動的提示詞：

搖臂鏡頭從站在巨大峽谷邊緣的孤獨徒步者低機位開始，然後升高到高空，展現日出時薄霧瀰漫的巨大峽谷。輕風逐漸變成宏偉管絃樂隨著鏡頭上升。

新增鏡頭術語讓你控制景深和視覺感受：

"淺景深" - 模糊背景，突出主體
"虛化" - 創造柔和的圓形背景模糊
"焦點切換" - 在單個鏡頭內在主體間切換焦點
"廣角鏡頭" - 擴大視野，新增輕微畸變
"微距鏡頭" - 極端特寫，窄焦點平面
"35mm膠片" - 新增有機顆粒和電影溫暖感

Veo 3.1的突出特點之一是原生音訊生成。該模型可以產生同步對話、音效和環境音訊——但只有在你明確提示時才會生成。

在提示詞中用引號包含角色對話。明確描述語調和表達方式：

昏暗辦公室中坐在桌後的偵探中景鏡頭。他抬頭用疲憊的聲音說："Of all the offices in this town, you had to walk into mine."黑色電影美學，戲劇性陰影。

對話提示詞技巧：

描述聲音特質（"疲憊的聲音"、"興奮的耳語"、"平靜單調"）
保持對話簡短——一兩句話效果最佳
讓對話語調與視覺風格匹配

明確描述聲音並將其與可見動作連線：

狹窄小巷在脈動霓虹招牌下發光，冷雨飄灑的全景鏡頭。遠處警報聲響起，霓虹輕柔嗡嗡聲，靜電噼啪聲，電流嗡鳴在雨聲下脈動。

設定與場景匹配的音訊環境：

雪夜中的孤獨小屋。風在松樹間呼嘯，屋內火焰噼啪聲，偶爾木樑吱嘎聲。舒適孤立的情緒。

生成帶音訊的影片

Veo 3.1生成同步音訊、對話和音效。用你自己的提示詞試試看。

試用Veo 3.1

Veo 3.1對藝術指導反應良好。你可以透過型別參考、調色描述和電影技術術語來引導視覺風格。

型別	使用關鍵詞
電影	"cinematic", "shot on 35mm film", "anamorphic lens"
紀錄片	"documentary style", "handheld camera", "natural lighting"
恐怖	"desaturated colors", "heavy grain", "low-angle", "flickering light"
科幻	"neon-lit", "futuristic", "holographic", "cyberpunk atmosphere"
廣告	"TV commercial style", "clean aesthetic", "professional lighting"
動漫	"Japanese anime style", "cel-shaded", "vibrant colors"

明確描述你想要的效果：

調色："cyan-magenta color grading"、"warm golden tones"、"muted pastel palette"
光線方向："dramatic side lighting"、"overhead natural light"、"backlit silhouette"
時間："golden hour"、"blue hour"、"harsh midday sun"、"overcast diffused light"

這是一個結合風格元素的示例：

雨中偵探穿長大衣站在黑暗小巷閃爍霓虹招牌下的中景鏡頭。他點燃香菸，火焰短暫照亮他飽經風霜的臉龐。冷雨持續飄灑。黑色電影美學，青洋紅調色。

Veo 3.1每次生成支援最多三張參考影象。這對於在多個片段中保持角色和場景一致性至關重要。你可以使用參考影象來：

在不同鏡頭中鎖定角色外觀
保持一致的環境或位置
保留特定物體細節（產品、道具、服裝）

當結合參考影象和文字提示詞時，文字引導動作和鏡頭，影象引導視覺身份。

Veo 3.1的首末幀功能讓你精確定義鏡頭的開始和結束。然後模型在兩幀之間生成自然運動。這對以下情況特別有效：

平滑變換序列
兩個特定構圖間的受控鏡頭運動
具有精確開始和結束狀態的場景過渡

你可以指定生成中要避免的元素。編寫負面提示詞時，描述你想排除的內容，不使用"不要"或"禁止"等詞：

"避免水印、文字覆蓋、字幕"
"排除鏡頭光暈、過曝、運動模糊"

這些是經過測試的提示詞，你可以立即複製、修改和使用Veo 3.1。

山崖邊岩石上時尚智慧手錶的特寫鏡頭。鏡頭從近距離開始然後平滑連續的無人機鏡頭拉遠。隨著上升，廣闊的高山景觀展開。產品廣告風格，戲劇性自然光照。

現代會議廳講臺前自信演講者的中景鏡頭。她自然手勢同時說道："The future of AI is not about replacement -- it is about collaboration."柔和舞臺燈光，專業企業美學。

黃昏時密林中獨狼在新雪中移動的全景跟拍鏡頭。側面跟拍鏡頭。爪下雪花嘎吱聲，風在松樹間低語。紀錄片風格，自然光照，35mm膠片顆粒。

醫院長空走廊盡頭孤獨身影的低角度全景鏡頭，熒光燈閃爍。身影緩慢走向鏡頭，腳步聲迴響。去飽和色彩，重顆粒，恐怖美學。

摩托車頭盔攝像頭沿蜿蜒海岸公路疾馳的主觀鏡頭。鏡頭傾斜進入彎道顯示懸崖邊和下方海洋。黃金時刻光照帶太陽光暈。高能量運動風格。

廚師雙手在大理石臺面上精心擺放新鮮食材的中景鏡頭，工作專注。鏡頭向上傾斜露出廚師專注表情。頂部自然光，溫馨生活美學。

模特穿著飄逸絲裙走過空曠藝術畫廊的慢推鏡頭。每一步都讓面料產生微妙波紋。柔和散射畫廊燈光，高階時尚編輯風格。

秋日午後溫暖陽光透過樹林，老人在公園長椅上喂鴿子的中景鏡頭。他停頓，抬頭帶著溫和微笑，葉子飄過。情感懷舊色調，淺景深。

雙手與透明全息顯示器互動特寫，滑動和捏合操作3D資料視覺化。藍白介面光輝照亮面部。未來主義科幻美學，簡潔設計。

反射黑色表面上奢華香水瓶的微距特寫，戲劇性聚光燈創造金色高光。瓶子緩慢旋轉露出優雅設計細節。高階商業美學。

最有效的Veo 3.1工作流遵循結構化迭代過程。

從4秒720p解析度的簡短清晰提示詞開始。這讓你以最小成本快速測試。

女性雨夜走過城市街道的全景鏡頭。

一旦基礎生成看起來正確，加入鏡頭、燈光和風格細節：

穿紅大衣女性雨夜走過城市街道的全景鏡頭。街對面跟拍鏡頭。溼潤路面霓虹倒影，憂鬱青橙調色。

新增聲音設計為場景注入生命：

穿紅大衣女性雨夜走過城市街道的全景鏡頭。街對面跟拍鏡頭。溼潤路面霓虹倒影，憂鬱青橙調色。雨點敲擊混凝土，遠處交通嗡嗡聲，她的高跟鞋有節奏敲擊。

當提示詞提供一致結果時，增加到8秒1080p獲得最終輸出。使用Veo 3.1標準版本獲得製作級質量結果，或快速版本繼續迭代。

迭代間一次改變一個變數（鏡頭或燈光，不要同時改變）
動作密集場景使用更短時長（4-6秒）
多次執行同一提示詞——每次生成產生略微不同結果
使用種子引數探索效果好的提示詞變體

開始使用Veo 3.1生成

在瀏覽器中直接使用Veo 3.1應用這些提示詞技巧。新使用者有免費積分。

免費試用

錯誤	失敗原因	解決方案
疊加多個鏡頭運動	衝突指令混淆模型	每個提示詞一個主要鏡頭運動
模糊主體描述	模型填入隨機細節	明確外觀、服裝、年齡
忽略音訊	錯失Veo 3.1最佳特性之一	總是包含音訊指導
提示詞過長	關鍵細節被稀釋	保持提示詞聚焦和結構化
跳過迭代	第一次嘗試很少完美	從簡單開始，逐步精煉
相關片段風格不一致	破壞視覺連續性	在相關提示詞間重複使用色調和風格描述符

編寫有效的Veo 3.1提示詞是一項可學習的技能。五要素公式（主體、動作、場景、風格、音訊）為你提供可靠的起始框架，而鏡頭控制、鏡頭效果和燈光的電影術語則解鎖專業級輸出。從簡單開始，系統性迭代，利用Veo 3.1的原生音訊生成創造真正出眾的影片。

掌握這些技巧的最佳方法是實踐操作。每個提示詞都會教你一些關於模型如何解釋你指令的知識。

AI Video Lab

AI video generation expert and content creator.