Stable Diffusion（简称SD）AI绘画入门教程包含（Stable Diffusion环境下载配置及部署）

破茧蝴蝶

1170人浏览 · 2025-11-14 11:06:36

破茧蝴蝶 · 2025-11-14 11:06:36 发布

文章目录

Stable Diffusion（简称SD）入门核心是先搞定安装部署，再掌握模型、提示词和基础参数的用法，小白建议从整合包入手降低难度。下面是详细的零基础入门教程，涵盖安装、基础操作和实战案例，帮你快速跑通绘图流程：

Stable Diffusion 前期准备与安装
1. Stable Diffusion 硬件与系统要求：系统推荐Win10 64位及以上；显卡优先选近几年的N卡，图像生成速度更快，低配置电脑也能使用但生成较慢；硬盘需预留足够空间存放模型和生成文件。
2. Stable Diffusion 下载整合包:
  Stable Diffusion v4.8 新手下载安装教程实操手册:https://blog.csdn.net/2501_93482703/article/details/154074605?spm=1011.2415.3001.10575&sharefrom=mp_manage_link
3. Stable Diffusion 安装启动：先运行整合包中的依赖程序（如dotnet相关程序）；解压整合包文件夹后，找到启动器程序（如“绘世启动器.exe”）双击打开；首次打开会自动检查更新文件，完成后点击“一键启动”，等待加载完成会自动弹出浏览器形式的SD主界面。
Stable Diffusion 核心基础：模型导入与选择
模型就像绘画的“风格模板”，不同模型对应不同画风，小白先掌握基础底模型和常用辅助模型即可。
1. 常见模型分类：基础底模型（checkpoint）是核心，必须且只能选一个，比如二次元风格的AnyLoRA、写实风格的Realistic Vision；辅助模型（如LoRA）用于强化细节，需配合底模使用；美化模型（VAE）可优化画面色彩，解决画面发灰问题。
2. 模型安装：下载模型文件（后缀多为.safetensors），复制到对应文件夹。基础底模型放入“sd-webui-xxx/models/Stable-diffusion”，LoRA模型放入“models/Lora”文件夹。可给模型配同名预览图，方便后续选择。
3. 模型调用：回到SD主界面，点击基础底模型下拉框旁的刷新按钮，就能看到新增模型；VAE模型在对应下拉框选择，默认可不用改，画面发灰时再启用；LoRA模型需点击界面对应图标选择，选择后会自动加入正向提示词。
关键操作：提示词编写
提示词是告诉AI画什么、不画什么，是生成效果的核心，需遵循基础规范。
1. 正向提示词：描述想要的画面元素，按优先级排序，涵盖画质、画风、主体、场景等。比如“2k画质，二次元风格，半身像，一个穿JK的女孩，坐在樱花树下，手持书本，暖色调”。
2. 反向提示词：排除劣质或不需要的元素，常用词汇如“低质量，模糊，畸形的手，错别字，水印，噪点”，避免生成画面出现明显瑕疵。
3. 基础规范：提示词建议用英文，用逗号分隔；若整合包带翻译插件，可输入中文后回车自动转换。
实操生成：文生图基础流程
完成上述设置后，就能尝试生成图片，步骤简单且可反复调试：
1. 选择生成模式：默认是“文生图”模式，适合从无到有生成画面。
2. 设置基础参数：图像尺寸可先选默认的512×512或768×768，新手别选太大尺寸；采样方法优先选Euler a（生成快）或DPM++ 2M Karras（效果好）；采样步数设20 - 30步即可，步数越多细节越足但生成越慢；CFG Scale设7 - 10，数值越高越贴合提示词，过高易失真。
3. 生成与调试：输入提示词后点击“生成”按钮。若生成效果差，可调整提示词、更换模型，或微调采样步数、CFG Scale等参数，多次尝试就能找到合适设置。
入门拓展：图生图基础
若想基于现有图片修改，可使用图生图功能：点击主界面“图生图”，上传参考图，调整“重绘幅度”（数值越低越接近原图，0.3 - 0.7较常用），再补充提示词，点击生成就能得到基于原图风格的新画面。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

从 Prompt 到 Skill：用五行开发链解决 AI Agent 工具链的质量门禁问题

泉眼 → 榫卯 → 淬炉 → 沙盘 → 铎声AI 生成的 Skill 如何获得可验证的质量保证？

智能体开发者社区

AI Agent可观测性实战：如何让多步推理黑盒“透明化”？

智能体开发者社区

【无标题】

【摘要】2025年AI Agent领域形成明确估值梯队，OpenKitty以独特优势成为唯一同时具备高代码工程能力和通用Agent能力的独立产品。评估显示，OpenKitty在11项能力维度中获得5项满分，其Go+Python+TS多语言架构支持5大原生通道和100+工具，构建了跨平台调度能力。相较之下，大厂系产品（如ClaudeCode）侧重代码能力，社区产品（如Hermes）则偏重通用形态。O