Stable Diffusion:模型
大家好,今天分享一下SD里面非常重要的一个基础设施: 模型它对生成图片的风格起着决定性的作用。就好比一个画家,在起笔绘画之前,要先确定画的是什么风格的画。是画动漫、画真人等。话不多说,下面跟我一起来看看吧。其他模型大家可以先大致了解一下,后面有使用到再详解。Embedding:含义是文本反演,也属于微调模型。相当于一连串关键词的集合。用于个性化图像生成。Hypernetworks:不太常用。LyC
大家好我是AIGC阿道夫
大家好,今天分享一下SD里面非常重要的一个基础设施: 模型
它对生成图片的风格起着决定性的作用。就好比一个画家,在起笔绘画之前,要先确定画的是什么风格的画。是画动漫、画真人等。话不多说,下面跟我一起来看看吧。
一. SD的模型分类


其他模型大家可以先大致了解一下,后面有使用到再详解。
-
Embedding:含义是文本反演,也属于微调模型。相当于一连串关键词的集合。用于个性化图像生成。
-
Hypernetworks:不太常用。
-
LyCORIS:此类模型可以归为Lora模型,属于微调模型的一种。
-
DreamBooth:可用于训练预调模型用的。使用指定主题的图像进行演算,训练后可以让模型产生更精细和个性化的输出图像。
二. 模型的下载
模型下载
C站:https://civitai.com(需要魔法)
Huggingface:https://huggingface.co
十个不同的VAE模型库:
-
PyTorch-VAE:一个基于PyTorch实现的高效VAE框架,提供了多种VAE变体的实现,包括基础的VAE、β-VAE、AnnealedVAE、DisentangledAAE等。
-
VQ-VAE:与基于能量的模型相比,具有更好的稳定性和扩散性能。
-
Conditional VAE:扩展了标准VAE的方法,使其能够处理条件生成任务。
-
Beta-VAE:通过调整β参数来控制生成样本的空间结构,以达到更好的视觉效果。
-
VQ-VAE-2:是对VQ-VAE的进一步改进,旨在提高生成图像的质量和多样性。
-
TD-VAE:专门处理时间序列数据的VAE变体,展现了卓越的性能。
-
LORA:虽然不是传统意义上的VAE模型,但在Stable Diffusion中作为外挂模型使用,用于改善生成图像的质量。
-
Safetensors:在Stable Diffusion中主要应用的是Vae-ft-mse-840000-ema-pruned版本,因为它能接近实际拍摄的效果。
-
ProFlow:与基于能量的模型相比,也具有较好的稳定性和扩散性能。
-
Auto regressive flows (ARF):虽然未在我搜索到的资料中直接提及,但ARF是一种先进的生成模型技术,通常与VAE结合使用,以提高生成样本的质量和多样性。
模型的存放路径
由于SD有不同的安装使用方式,常见的主要有3种:
-
借助平台搭建安装:例如借助Kaggle平台
-
云平台搭建安装:例如阿里云、青椒云等
-
自己本地电脑安装
一般模型的存放路径都大同小异,大致都是*/主目录/models/模型分类文件夹/模型。其中模型分类文件夹可能会区分大小写,但是大家熟悉了模型分类后大致都可以看明白。
这个是我使用的云平台SD模型文件的存放路径。

模型类别识别工具
有时候我们下载了一个模型,但是不知道它属于哪种模型的,不知道要保存或上传到哪个文件夹。我们可以用到秋叶的模型解析工具。
网址为https://spell.novelai.dev/


如何训练LorA
对于很多刚学习AI绘画的小伙伴而言,想要提升、学习新技能,往往是自己摸索成长,不成体系的学习效果低效漫长且无助。
如果你苦于没有一份Lora模型训练学习系统完整的学习资料,这份网易的《Stable Diffusion LoRA模型训练指南》电子书,尽管拿去好了。
包知识脉络 + 诸多细节。节省大家在网上搜索资料的时间来学习,也可以分享给身边好友一起学习。
由于内容过多,下面以截图展示目录及部分内容,完整文档领取方式点击下方微信卡片,即可免费获取!



篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的卡片进行领取!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)