文章目录


Stable Diffusion的常用模型按功能可分为Checkpoint(底模型)LoRA(微调模型)ControlNet(控制模型)VAE(美化模型) 等核心类别,各类模型分工不同,适配不同绘画需求,以下是具体常用模型介绍:

  1. Checkpoint(底模型/主模型)
    这是SD绘图的基础核心模型,包含生成图像的完整参数,体积多在2G - 7G,决定画面的核心画风,不同模型擅长领域差异明显:
    • Stable Diffusion v1.5:最经典的通用基础模型,适配各类画风,无过多创作限制,是很多二次训练模型的基础,新手入门适配性极强,默认生成尺寸512×512像素。
    • Chilloutmix:爆款真人写实模型,主打亚洲风,在C站下载量超70万。只需简单提示词就能生成逼真的真人图像,搭配KoreanDollLikeness(韩式美女)LoRA使用,能生成效果惊艳的韩式写实人像。
    • Guofeng3(国风3):由B站作者制作的2.5D模型,偏亚洲风,专为国漫角色和国风场景设计,生成的人物、场景充满中式美学,搭配国风相关LoRA可强化古风细节。
    • Anything系列(v3/v4.5/v5.0):二次元领域的标杆模型,擅长生成萌系、唯美等多种二次元风格角色,线条和色彩贴合二次元插画审美,是二次元爱好者的常用选择。
    • Realistic Vision:偏欧美风的写实模型,在人物皮肤质感、光影细节上表现出色,生成的画面接近照片质感,适合创作欧美风写真、写实场景等内容。
  2. LoRA(微调模型)
    体积小巧(10M - 200M),需搭配底模型使用,用于强化特定风格、人物特征或细节,灵活度极高:
    • Korean Doll Likeness:韩式美女专属LoRA,常和Chilloutmix底模搭配,能让生成的人物拥有韩式妆容、五官特征,是创作韩式写真的必备微调模型。
    • 墨心:国风风格LoRA,可强化水墨、工笔等中式绘画细节,搭配Guofeng3等国风底模,能让画面的笔触、色彩更具传统国画韵味。
    • Cute Girl mix:主打萌系少女风格,能优化角色的脸型、五官比例,让人物呈现出娇俏可爱的气质,适配各类二次元底模型。
  3. ControlNet(控制模型)
    专注于画面细节与结构控制,解决AI绘画中姿势、构图混乱等问题,需安装对应扩展使用,常用子模型有:
    • Canny:基于边缘检测控制构图,上传参考图后,模型会依据图像的边缘线条生成匹配构图的画面,适合控制复杂场景的构图框架。
    • OpenPose:核心姿势控制模型,可通过骨骼图定义人物动作,轻松解决AI画手、画姿势畸形的问题,常用于生成特定动作的人物插画、动漫角色。
    • Depth:依据深度图控制画面的空间层次,让生成的图像有清晰的远近透视关系,适合创作有立体感的场景、建筑或人物群像。
  4. VAE(美化模型)
    主要用于优化画面色彩与画质,解决生成图发灰、色彩暗淡的问题,无需复杂设置,切换即可生效:
    • kl - f8 - anime2:专为二次元模型设计,能提亮画面色彩,让二次元角色的头发、服饰色彩更鲜艳饱满,适配Anything等二次元底模。
    • vae - ft - mse - 840000 - ema - pruned:通用型美化模型,对写实类模型友好,可优化写实画面的肤色质感、光影过渡,避免画面出现偏灰、色彩不均的问题。
  5. 其他辅助模型
    • Textual Inversion(文本反转模型):体积仅几KB,通过自定义关键词向模型传递新风格或元素,比如自定义某类服饰、符号,输入对应关键词即可调用,使用时直接写入提示词即可。
    • CodeFormer:专注于画面修复,常用于人脸修复、图像分辨率提升,比如修正生成图中模糊的五官,或把低清图像优化为高清画质,在WebUI的Extras菜单中可直接使用。
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐