第 5 课|Prompt 结构详解:从灵感到镜头
摘要:本文系统讲解了视频生成中Prompt的结构化写作方法。Prompt本质是"镜头语言",由六大要素构成:场景、主体、动作、光线、情绪和镜头运动。通过明确这些要素(如"夕阳下银色汽车沿海岸线行驶"),可以精准控制画面构图、氛围和视角。文章提供了视觉修辞词汇表,并演示了从灵感到Prompt的转化过程,强调用具体动词和描述性词语提升画面质感。最后通过拆解和创作
一、Prompt 的本质:文字即镜头
在前几课中,我们学习了如何用文字生成视频,并了解了商业视频中不同类型的 Prompt 写法。 从这一课开始,我们将更深入地掌握 Prompt 的结构逻辑——也就是如何让一句文字真正转化为符合你想象的视频画面。
Prompt 不只是“指令”,而是“镜头语言”。 它决定了 AI 如何理解你的创意、构图、光线与情绪。
Sora 2 的视频生成逻辑建立在视觉语言之上。 当你输入一段文字时,系统会自动解析其中的语义结构,将其拆分为“场景、主体、动作、光线、情绪、镜头”等要素,然后组合成连贯的视觉表现。
二、Prompt 的核心语法结构
每一条高质量的 Prompt,实质上都是一句“完整的镜头描述”。 写 Prompt 的思维方式,类似于导演对摄影师下达拍摄指令。
基本语法公式:
场景 → 主体 → 动作 → 光线 → 情绪 → 镜头运动
这六个部分构成了一句 Prompt 的核心逻辑。 在实际写作时,可以根据需要省略某些部分,但整体顺序建议保持一致,以便 Sora 2 正确理解你的意图。
示例讲解
Prompt:
“A silver car drives along a coastal highway, aerial view, golden sunset, cinematic tone.”
结构拆解:
要素:场景 内容:coastal highway 说明:画面空间与环境基调
要素:主体 内容:silver car 说明:视频的主要对象
要素:动作 内容:drives along 说明:体现动态与方向
要素:光线 内容:golden sunset 说明:决定视觉氛围
要素:镜头 内容:aerial view 说明:定义观众视角
要素:风格 内容:cinematic tone 说明:控制整体影调与色彩感
通过这样清晰的结构,你不仅能让 Sora 理解“你想要什么”,还可以让生成画面具有更稳定的风格与故事感。
三、六要素的逻辑与控制重点
让我们更具体地理解每个要素在 Prompt 中的作用。
1. 场景(Scene)
定义画面的空间环境与时间背景,是视频的“舞台”。
-
示例:
in a modern office,on a beach at sunrise,inside a cozy cafe -
建议:场景越明确,AI 越容易生成一致的空间感。
2. 主体(Subject)
决定画面的核心焦点。 主体可以是人物、物体、动物或抽象元素。
-
示例:
a young woman,a red sports car,a flying drone -
建议:尽量明确性别、年龄、特征,有助于画面细节更真实。
3. 动作(Action)
体现画面的动态与节奏,是构图的“生命力”。
-
示例:
walking through,opening,spinning,holding,running -
建议:动词尽量具体,不使用模糊词如 “doing something”。
4. 光线(Lighting)
控制画面的亮度与质感,塑造空间与氛围。
-
示例:
soft light,golden sunset,neon reflection,morning light -
建议:用时间与光线词结合能强化自然感,例如 “sunset light” 或 “foggy morning”。
5. 情绪(Mood)
传达画面给人的感受,是商业视频中非常关键的一环。
-
示例:
romantic,energetic,mysterious,calm,elegant -
建议:根据视频目标匹配情绪词,如品牌广告常用
inspiring、modern。
6. 镜头运动(Camera Movement)
决定视频的视觉节奏与观众视角。
-
示例:
close-up,tracking shot,wide shot,panning,aerial view -
建议:加入“镜头词”能显著提升视频的专业感与方向感。
四、视觉修辞词汇推荐
掌握一些常用的视觉修辞词汇,可以让你的 Prompt 更具表现力与专业性。 以下是常见词汇分类表,建议在写作时参考使用。
功能:光影 示例词汇:soft light, golden hour, neon light, foggy atmosphere
功能:镜头 示例词汇:close-up, tracking shot, wide shot, dolly zoom
功能:风格 示例词汇:cinematic, dreamy, minimalistic, high contrast
功能:情绪 示例词汇:energetic, elegant, mysterious, inspiring
这些词汇能够帮助你在画面中创造不同的质感与叙事效果。 例如:
-
golden hour表示傍晚的柔金光线; -
high contrast强调黑白或明暗对比; -
dreamy用于柔光或浪漫氛围场景。
五、Prompt 写作思路与灵感转化
许多创作者在写 Prompt 时会遇到困难:脑中有画面,但不知道如何准确表达。 解决方法是把视觉印象转化为语言结构。
步骤:
-
先想画面,不想词汇:脑海中构思你要的镜头。
-
列出关键词:场景、人物、光线、情绪。
-
串联成句:使用“从大到小”的顺序组织文字。
示例:
灵感画面:
一个年轻女性在早晨的咖啡馆里打开笔记本电脑,阳光洒在桌面上,氛围安静。
Prompt:
A young woman opens a laptop in a cozy cafe, sunlight shines through the window, calm morning mood.
拆解结构:
要素:场景 内容:cozy cafe
要素:主体 内容:young woman
要素:动作: 内容:opens a laptop
要素:光线 内容:sunlight through the window
要素:情绪 内容:calm
要素:镜头 内容:morning mood(氛围与节奏感)
六、练习任务
请你完成以下练习,熟悉 Prompt 的结构化写作方式。
-
拆解练习 将下面这条 Prompt 拆分为六个要素(场景、主体、动作、光线、情绪、镜头):
“A young woman opens a laptop in a cozy cafe, sunlight shines through the window, calm morning mood.”
-
创作练习 尝试编写你自己的 Prompt,描述一个你想要的视频场景。 要求包含至少四个要素(场景、主体、动作、光线、情绪)。
-
延伸思考 尝试用不同光线或情绪词改写同一场景,例如:
-
改写为傍晚版本
-
改写为都市风格版本
七、本课总结
通过本课学习,你已经掌握:
学习重点:理解 Prompt 的核心语法结构 收获:能写出完整、连贯的镜头描述
学习重点:掌握六要素写作逻辑 收获:能控制画面构图、光线、情绪与镜头感
学习重点:熟悉常用视觉修辞词汇 收获:提升 Prompt 的专业性与艺术感
学习重点:能从灵感转化为语言 收获:把脑海中的画面清晰表达出来
Prompt 是连接创意与视频生成的桥梁。 当你学会使用结构化思维去表达视觉语言,就能让 AI 精确理解你的创作意图。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)