AiPy生图神级教程，手把手教你公式化拆解提示词，质量next level！

大家好，在分享过两次视频工作流后很多小伙伴都进行了自己的尝试，也做出了属于自己的第一个短视频。但是也有朋友反应，生成的画面和自己的想象有出入，或者对画面的质量有更高要求，这些朋友往往都是基于AI生成的提示词模板直接生成画面和视频，所以在文本“抽奖”和图片“抽奖”的双buff下，画面的生成也充满了随机性。所以今天想要跟大家交流的就是如何使用“公式化”提示词格式，提高画面的质量与稳定性！

Pope789

1571人浏览 · 2025-07-29 10:20:51

Pope789 · 2025-07-29 10:20:51 发布

一、AiPy使用百科

AiPy是一款融合LLM与Python开发生态的开源AI工具。它基于 “Python Use” 理念开发，旨在实现 “让AI控制你的电脑”的目标。

无代理化通用任务执行框架：首创“代码即代理”技术理念，通过大模型解析用户需求并拆解任务，动态生成Python代码来调用本地资源，实现跨领域自动化操作，如医疗检查单分析、打印机批量控制等。
全本地化安全计算架构：支持全功能本地化部署，敏感数据处理在本地完成，避免云端传输风险，提供免费模型接入方案，满足企业级数据安全与合规要求。
Python 生态深度集成方案：依托Python丰富工具链体系，结合大模型自然语言理解能力，实现 “需求语义 - 执行代码 - 系统操作”双向驱动，可生成邮件定时发送脚本等复杂功能模块。
弹性兼容的技术架构设计：支持主流大模型API接入，兼容本地模型部署方案，提供 Windows/macOS/Linux 多系统安装包及一键运行版本，还支持自定义API调用，可与企业现有业务系统无缝集成。

使用门槛与部署方式：提供一键安装包，普通用户无需代码基础即可直接运行，支持本地化部署，可在 Windows、macOS 等系统上使用，用户只需描述需求，AI 就能自主分析本地数据、操作本地应用并返回结果。

二、文生图API配置

2.1、豆包API key申请

任何满足文生图功能的大模型都可以使用，我这里使用的是doubao-seededit大模型。

在API key管理中，创建自己的key。

2.2、配置文件

打开C:\Users\Administrator\.aipyapp\ user_config.toml，将配置信息复制并替换自己的API key。

不同API的配置信息都可以在相应大模型官网的参考文档中查询，这里还是以豆包为例。

[api.doubaollm]

env.doubaollm_api_key=["02xxxxxxxx", "豆包文生图模型API密钥"]

desc = """将文字转化为图片，同步调用示例代码如下：



curl -X POST https://ark.cn-beijing.volces.com/api/v3/images/generations \

  -H "Content-Type: application/json" \

  -H "Authorization: Bearer key" \

  -d '{

    "model": "doubao-seedream-3-0-t2i-250415",

    "prompt": "鱼眼镜头，一只猫咪的头部，画面呈现出猫咪的五官因为拍摄方式扭曲的效果。",

    "response_format": "url",

    "size": "1024x1024","1280x720 ",

    "seed": 12,

    "guidance_scale": 2.5,

    "watermark": true

}'

输出示例

{

  "model": "doubao-seedream-3-0-t2i-250415"

  "created": 1589478378,

  "data": [

    {

      "url": "https://..."

    }

  ],

  "usage": {

      "generated_images": 1

      "output_tokens": xx

      "total_tokens": xx

     

  }

}

图片生成完毕后，可以获取到URL址址，你需要将图片下载并保存到当前工作目录，文件名为提炼后的任务描述。

"""

三、提示词编写

3.1、提示词公式

提示词公式的提出并不是让我们完全放弃AI生成，相反是为了让AI生成的更好，当AI文本缺失一部分内容的时候，我们可以通过公式拆解的方式去发现并调整，从而提高画面的整体质量。一个完整的AI绘画提示词可以概括为以下7个部分：

1. 风格限定：奠定视觉基调的核心要素

风格限定是定义画面视觉语言的关键，它明确指引着整体画风的走向。无论是奇幻瑰丽的梦境风格、细腻柔和的手绘质感，还是灵动写意的水彩笔触，都能精准锚定画面的艺术气质。也可通过对标艺术大师的创作风格，如梵高的浓烈笔触、吉卜力工作室的治愈美学，或是宫崎骏动画的奇幻浪漫，让 AI 快速抓取标志性艺术元素，生成独具特色的视觉作品。

2. 视角构图：构建独特视觉叙事的框架

视角与构图共同构建画面的叙事语言。低角度仰拍赋予主体宏伟庄严感，中心构图则能瞬间聚焦观众视线。视角决定观察主体的独特站位，而构图负责对画面元素进行精心编排，通过比例、位置与层次的巧妙设计，引导观众的视觉动线，塑造富有张力的画面效果。

3. 主体描述：塑造核心角色的精准画像

主体描述需要对画面核心进行细致入微的刻画。以生物主体为例，需明确姿态、外形与细节特征，如 “昂首嘶鸣的独角兽，覆着莹白绸缎般的皮毛，头顶螺旋状的银角泛着微光”；若为人物，则需从性别、年龄、服饰、妆容、神态等多维度精准勾勒，确保 AI 能捕捉到每个细节，生成贴合预期的主体形象。

4. 背景设定：营造沉浸场景的叙事舞台

背景设定如同为主体搭建专属的叙事剧场。“晨雾弥漫的原始森林中，金色光束穿透层叠枝叶，在腐殖土上投下细碎光斑”，短短语句便构建出空间维度、时间节点与环境氛围，不仅赋予画面故事感，更让主体的存在与行动具备合理场景依托。

5. 细节修饰：赋予画面生命力的点睛之笔

细节是激活画面灵魂的关键元素。通过添加动态或交互元素，如 “独角兽蹄边簇拥着摇曳的铃兰，树影间探出松鼠好奇的红眼睛”，让场景产生动态叙事感。这些细腻刻画不仅丰富视觉层次，更能引发观众的情感共鸣，使画面跃然纸上。

6. 光影色调：渲染情绪氛围的视觉调色板

光影与色调是传递情感的视觉密码。“暖橘色夕阳为建筑镀上金边，拉长的影子温柔地躺在石板路上”营造出温馨治愈的氛围；而“幽蓝月光刺破浓云，冷冽阴影吞噬着古堡尖顶”*则瞬间塑造出神秘压抑的意境。通过对光线方向、强度与色彩的精准把控，为画面注入独特的情感基调。

7. 质量词：保障画面品质的量化标准

质量词用于明确画面的技术指标与美学要求。使用 “4K 超清、超写实纹理、电影级光影”等专业表述，或是“细腻柔和、唯美梦幻、质感高级”等感性描述，能让 AI 在生成时兼顾技术精度与艺术质感，确保最终输出达到理想的视觉效果。

其实大多数情况下，AI可以帮我们完成主体、细节、背景和质量词的编写，所以风格、视角和光影就是我们必须深度学习的内容。

3.2、案例对比

首先，我们直接使用AI生成的提示词去完成图片生成。“摩托车手在夜街高速疾驰，未来感建筑荧光绿与酸性粉渐变光晕，高饱和霓虹招牌，车身被霓虹光影勾勒出轮廓，阴影深靛暗红强化复古科幻感”

然后，我们按照公式优化一下提示词：

风格限定：赛博朋克风格，90s复古蒸汽风，赛璐璐动画风格

视角构图：第三人称低角度倾斜镜头，对角线构图

主体描述：摩托车手在夜街高速疾驰，前景聚焦后轮

背景设定：未来感建筑荧光绿与酸性粉渐变光晕，高饱和明黄"AiPy"霓虹招牌

细节修饰：伦勃朗光勾勒车手轮廓，车身被霓虹光影勾勒出轮廓，尾焰拖曳出橙红色的动态光轨，湿漉路面倒映光斑

光阴色调：冷暖色调对比，阴影深靛暗红强化复古科幻感

质量词：细节丰富，色彩鲜艳，画面流畅，质感强烈，动态模糊突出

可以看到，用这样的方式不仅能提高图片的画面美感，同时也增加了创作者对画面的掌控度；作为新手也可以用这样的分类方式积累关键词，丰富自己的提示词素材。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla