Stable Diffusion有哪些常用的模型？

破茧蝴蝶

590人浏览 · 2025-11-14 11:10:27

破茧蝴蝶 · 2025-11-14 11:10:27 发布

文章目录

Stable Diffusion的常用模型按功能可分为Checkpoint（底模型）、LoRA（微调模型）、ControlNet（控制模型）、VAE（美化模型） 等核心类别，各类模型分工不同，适配不同绘画需求，以下是具体常用模型介绍：

Checkpoint（底模型/主模型）
这是SD绘图的基础核心模型，包含生成图像的完整参数，体积多在2G - 7G，决定画面的核心画风，不同模型擅长领域差异明显：
- Stable Diffusion v1.5：最经典的通用基础模型，适配各类画风，无过多创作限制，是很多二次训练模型的基础，新手入门适配性极强，默认生成尺寸512×512像素。
- Chilloutmix：爆款真人写实模型，主打亚洲风，在C站下载量超70万。只需简单提示词就能生成逼真的真人图像，搭配KoreanDollLikeness（韩式美女）LoRA使用，能生成效果惊艳的韩式写实人像。
- Guofeng3（国风3）：由B站作者制作的2.5D模型，偏亚洲风，专为国漫角色和国风场景设计，生成的人物、场景充满中式美学，搭配国风相关LoRA可强化古风细节。
- Anything系列（v3/v4.5/v5.0）：二次元领域的标杆模型，擅长生成萌系、唯美等多种二次元风格角色，线条和色彩贴合二次元插画审美，是二次元爱好者的常用选择。
- Realistic Vision：偏欧美风的写实模型，在人物皮肤质感、光影细节上表现出色，生成的画面接近照片质感，适合创作欧美风写真、写实场景等内容。
LoRA（微调模型）
体积小巧（10M - 200M），需搭配底模型使用，用于强化特定风格、人物特征或细节，灵活度极高：
- Korean Doll Likeness：韩式美女专属LoRA，常和Chilloutmix底模搭配，能让生成的人物拥有韩式妆容、五官特征，是创作韩式写真的必备微调模型。
- 墨心：国风风格LoRA，可强化水墨、工笔等中式绘画细节，搭配Guofeng3等国风底模，能让画面的笔触、色彩更具传统国画韵味。
- Cute Girl mix：主打萌系少女风格，能优化角色的脸型、五官比例，让人物呈现出娇俏可爱的气质，适配各类二次元底模型。
ControlNet（控制模型）
专注于画面细节与结构控制，解决AI绘画中姿势、构图混乱等问题，需安装对应扩展使用，常用子模型有：
- Canny：基于边缘检测控制构图，上传参考图后，模型会依据图像的边缘线条生成匹配构图的画面，适合控制复杂场景的构图框架。
- OpenPose：核心姿势控制模型，可通过骨骼图定义人物动作，轻松解决AI画手、画姿势畸形的问题，常用于生成特定动作的人物插画、动漫角色。
- Depth：依据深度图控制画面的空间层次，让生成的图像有清晰的远近透视关系，适合创作有立体感的场景、建筑或人物群像。
VAE（美化模型）
主要用于优化画面色彩与画质，解决生成图发灰、色彩暗淡的问题，无需复杂设置，切换即可生效：
- kl - f8 - anime2：专为二次元模型设计，能提亮画面色彩，让二次元角色的头发、服饰色彩更鲜艳饱满，适配Anything等二次元底模。
- vae - ft - mse - 840000 - ema - pruned：通用型美化模型，对写实类模型友好，可优化写实画面的肤色质感、光影过渡，避免画面出现偏灰、色彩不均的问题。
其他辅助模型
- Textual Inversion（文本反转模型）：体积仅几KB，通过自定义关键词向模型传递新风格或元素，比如自定义某类服饰、符号，输入对应关键词即可调用，使用时直接写入提示词即可。
- CodeFormer：专注于画面修复，常用于人脸修复、图像分辨率提升，比如修正生成图中模糊的五官，或把低清图像优化为高清画质，在WebUI的Extras菜单中可直接使用。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

7月18日更新，ChatGPT Plus、ChatGPT Pro 与 Codex：未来的软件开发（GPT5.6）

工程中间表示不是代码，也不是普通需求文档。它是一种面向 AI Agent 执行的结构化任务模型。

智能体开发者社区

Agent 入门学习指南：写给完全没基础的你

智能体开发者社区

2026年7月更新：ChatGPT Pro、Plus 与 Codex 如何进入事件驱动软件架构（GPT-5.6与AI Agent技术分享）

传统软件等待用户请求。事件驱动软件监听系统变化。AI Agent 系统则在变化发生后，尝试理解变化、判断影响、规划任务并推进执行。收到命令后执行状态变化后响应状态变化后理解、规划并执行ChatGPT Plus、ChatGPT Pro 与 Codex 共同构成了这种系统的基础雏形。事件发生↓ChatGPT Plus 整理语义↓ChatGPT Pro 判断影响并规划↓Codex 在边界内执行↓测试系统