大家好,在分享过两次视频工作流后很多小伙伴都进行了自己的尝试,也做出了属于自己的第一个短视频。但是也有朋友反应,生成的画面和自己的想象有出入,或者对画面的质量有更高要求,这些朋友往往都是基于AI生成的提示词模板直接生成画面和视频,所以在文本“抽奖”和图片“抽奖”的双buff下,画面的生成也充满了随机性。所以今天想要跟大家交流的就是如何使用“公式化”提示词格式,提高画面的质量与稳定性!

一、AiPy使用百科

AiPy是一款融合LLMPython开发生态的开源AI工具。它基于 “Python Use” 理念开发,旨在实现AI控制你的电脑的目标。

  1. 无代理化通用任务执行框架:首创“代码即代理”技术理念,通过大模型解析用户需求并拆解任务,动态生成Python代码来调用本地资源,实现跨领域自动化操作,如医疗检查单分析、打印机批量控制等。
  2. 全本地化安全计算架构:支持全功能本地化部署,敏感数据处理在本地完成,避免云端传输风险,提供免费模型接入方案,满足企业级数据安全与合规要求。
  3. Python 生态深度集成方案:依托Python丰富工具链体系,结合大模型自然语言理解能力,实现 “需求语义 - 执行代码 - 系统操作”双向驱动,可生成邮件定时发送脚本等复杂功能模块。
  4. 弹性兼容的技术架构设计:支持主流大模型API接入,兼容本地模型部署方案,提供 Windows/macOS/Linux 多系统安装包及一键运行版本,还支持自定义API调用,可与企业现有业务系统无缝集成。

使用门槛与部署方式:提供一键安装包,普通用户无需代码基础即可直接运行,支持本地化部署,可在 Windows、macOS 等系统上使用,用户只需描述需求,AI 就能自主分析本地数据、操作本地应用并返回结果。

二、文生图API配置

2.1、豆包API key申请

任何满足文生图功能的大模型都可以使用,我这里使用的是doubao-seededit大模型。

在API key管理中,创建自己的key。

2.2、配置文件

打开C:\Users\Administrator\.aipyapp\ user_config.toml,将配置信息复制并替换自己的API key。

不同API的配置信息都可以在相应大模型官网的参考文档中查询,这里还是以豆包为例。

[api.doubaollm]

env.doubaollm_api_key=["02xxxxxxxx", "豆包文生图模型API密钥"]

desc = """将文字转化为图片,同步调用示例代码如下:



curl -X POST https://ark.cn-beijing.volces.com/api/v3/images/generations \

  -H "Content-Type: application/json" \

  -H "Authorization: Bearer key" \

  -d '{

    "model": "doubao-seedream-3-0-t2i-250415",

    "prompt": "鱼眼镜头,一只猫咪的头部,画面呈现出猫咪的五官因为拍摄方式扭曲的效果。",

    "response_format": "url",

    "size": "1024x1024","1280x720 ",

    "seed": 12,

    "guidance_scale": 2.5,

    "watermark": true

}'

输出示例

{

  "model": "doubao-seedream-3-0-t2i-250415"

  "created": 1589478378,

  "data": [

    {

      "url": "https://..."

    }

  ],

  "usage": {

      "generated_images": 1

      "output_tokens": xx

      "total_tokens": xx

     

  }

}

图片生成完毕后,可以获取到URL址址,你需要将图片下载并保存到当前工作目录,文件名为提炼后的任务描述。

"""

三、提示词编写

3.1、提示词公式

提示词公式的提出并不是让我们完全放弃AI生成,相反是为了让AI生成的更好,当AI文本缺失一部分内容的时候,我们可以通过公式拆解的方式去发现并调整,从而提高画面的整体质量。一个完整的AI绘画提示词可以概括为以下7个部分:

1. 风格限定:奠定视觉基调的核心要素

风格限定是定义画面视觉语言的关键,它明确指引着整体画风的走向。无论是奇幻瑰丽的梦境风格、细腻柔和的手绘质感,还是灵动写意的水彩笔触,都能精准锚定画面的艺术气质。也可通过对标艺术大师的创作风格,如梵高的浓烈笔触、吉卜力工作室的治愈美学,或是宫崎骏动画的奇幻浪漫,让 AI 快速抓取标志性艺术元素,生成独具特色的视觉作品。​

2. 视角构图:构建独特视觉叙事的框架

视角与构图共同构建画面的叙事语言。低角度仰拍赋予主体宏伟庄严感,中心构图则能瞬间聚焦观众视线。视角决定观察主体的独特站位,而构图负责对画面元素进行精心编排,通过比例、位置与层次的巧妙设计,引导观众的视觉动线,塑造富有张力的画面效果。​

3. 主体描述:塑造核心角色的精准画像

主体描述需要对画面核心进行细致入微的刻画。以生物主体为例,需明确姿态、外形与细节特征,如 “昂首嘶鸣的独角兽,覆着莹白绸缎般的皮毛,头顶螺旋状的银角泛着微光”;若为人物,则需从性别、年龄、服饰、妆容、神态等多维度精准勾勒,确保 AI 能捕捉到每个细节,生成贴合预期的主体形象。​

4. 背景设定:营造沉浸场景的叙事舞台

背景设定如同为主体搭建专属的叙事剧场。“晨雾弥漫的原始森林中,金色光束穿透层叠枝叶,在腐殖土上投下细碎光斑”,短短语句便构建出空间维度、时间节点与环境氛围,不仅赋予画面故事感,更让主体的存在与行动具备合理场景依托。​

5. 细节修饰:赋予画面生命力的点睛之笔

细节是激活画面灵魂的关键元素。通过添加动态或交互元素,如 “独角兽蹄边簇拥着摇曳的铃兰,树影间探出松鼠好奇的红眼睛”,让场景产生动态叙事感。这些细腻刻画不仅丰富视觉层次,更能引发观众的情感共鸣,使画面跃然纸上。​

6. 光影色调:渲染情绪氛围的视觉调色板

光影与色调是传递情感的视觉密码。“暖橘色夕阳为建筑镀上金边,拉长的影子温柔地躺在石板路上”营造出温馨治愈的氛围;而“幽蓝月光刺破浓云,冷冽阴影吞噬着古堡尖顶”*则瞬间塑造出神秘压抑的意境。通过对光线方向、强度与色彩的精准把控,为画面注入独特的情感基调。​

7. 质量词:保障画面品质的量化标准

质量词用于明确画面的技术指标与美学要求。使用 “4K 超清、超写实纹理、电影级光影”等专业表述,或是“细腻柔和、唯美梦幻、质感高级”等感性描述,能让 AI 在生成时兼顾技术精度与艺术质感,确保最终输出达到理想的视觉效果。

其实大多数情况下,AI可以帮我们完成主体、细节、背景和质量词的编写,所以风格、视角和光影就是我们必须深度学习的内容。

3.2、案例对比

首先,我们直接使用AI生成的提示词去完成图片生成。“摩托车手在夜街高速疾驰,未来感建筑荧光绿与酸性粉渐变光晕,高饱和霓虹招牌,车身被霓虹光影勾勒出轮廓,阴影深靛暗红强化复古科幻感

然后,我们按照公式优化一下提示词:

风格限定:赛博朋克风格,90s复古蒸汽风,赛璐璐动画风格

视角构图:第三人称低角度倾斜镜头,对角线构图

主体描述:摩托车手在夜街高速疾驰,前景聚焦后轮

背景设定:未来感建筑荧光绿与酸性粉渐变光晕,高饱和明黄"AiPy"霓虹招牌

细节修饰:伦勃朗光勾勒车手轮廓,车身被霓虹光影勾勒出轮廓,尾焰拖曳出橙红色的动态光轨,湿漉路面倒映光斑

光阴色调:冷暖色调对比,阴影深靛暗红强化复古科幻感

质量词:细节丰富,色彩鲜艳,画面流畅,质感强烈,动态模糊突出

可以看到,用这样的方式不仅能提高图片的画面美感,同时也增加了创作者对画面的掌控度;作为新手也可以用这样的分类方式积累关键词,丰富自己的提示词素材。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐