文章目录


Stable Diffusion(简称SD)入门核心是先搞定安装部署,再掌握模型、提示词和基础参数的用法,小白建议从整合包入手降低难度。下面是详细的零基础入门教程,涵盖安装、基础操作和实战案例,帮你快速跑通绘图流程:

  1. Stable Diffusion 前期准备与安装
    1. Stable Diffusion 硬件与系统要求:系统推荐Win10 64位及以上;显卡优先选近几年的N卡,图像生成速度更快,低配置电脑也能使用但生成较慢;硬盘需预留足够空间存放模型和生成文件。

    2. Stable Diffusion 下载整合包:
      Stable Diffusion v4.8 新手下载安装教程实操手册:https://blog.csdn.net/2501_93482703/article/details/154074605?spm=1011.2415.3001.10575&sharefrom=mp_manage_link

    3. Stable Diffusion 安装启动:先运行整合包中的依赖程序(如dotnet相关程序);解压整合包文件夹后,找到启动器程序(如“绘世启动器.exe”)双击打开;首次打开会自动检查更新文件,完成后点击“一键启动”,等待加载完成会自动弹出浏览器形式的SD主界面。

  2. Stable Diffusion 核心基础:模型导入与选择
    模型就像绘画的“风格模板”,不同模型对应不同画风,小白先掌握基础底模型和常用辅助模型即可。
    1. 常见模型分类:基础底模型(checkpoint)是核心,必须且只能选一个,比如二次元风格的AnyLoRA、写实风格的Realistic Vision;辅助模型(如LoRA)用于强化细节,需配合底模使用;美化模型(VAE)可优化画面色彩,解决画面发灰问题。
    2. 模型安装:下载模型文件(后缀多为.safetensors),复制到对应文件夹。基础底模型放入“sd-webui-xxx/models/Stable-diffusion”,LoRA模型放入“models/Lora”文件夹。可给模型配同名预览图,方便后续选择。
    3. 模型调用:回到SD主界面,点击基础底模型下拉框旁的刷新按钮,就能看到新增模型;VAE模型在对应下拉框选择,默认可不用改,画面发灰时再启用;LoRA模型需点击界面对应图标选择,选择后会自动加入正向提示词。
  3. 关键操作:提示词编写
    提示词是告诉AI画什么、不画什么,是生成效果的核心,需遵循基础规范。
    1. 正向提示词:描述想要的画面元素,按优先级排序,涵盖画质、画风、主体、场景等。比如“2k画质,二次元风格,半身像,一个穿JK的女孩,坐在樱花树下,手持书本,暖色调”。
    2. 反向提示词:排除劣质或不需要的元素,常用词汇如“低质量,模糊,畸形的手,错别字,水印,噪点”,避免生成画面出现明显瑕疵。
    3. 基础规范:提示词建议用英文,用逗号分隔;若整合包带翻译插件,可输入中文后回车自动转换。
  4. 实操生成:文生图基础流程
    完成上述设置后,就能尝试生成图片,步骤简单且可反复调试:
    1. 选择生成模式:默认是“文生图”模式,适合从无到有生成画面。
    2. 设置基础参数:图像尺寸可先选默认的512×512或768×768,新手别选太大尺寸;采样方法优先选Euler a(生成快)或DPM++ 2M Karras(效果好);采样步数设20 - 30步即可,步数越多细节越足但生成越慢;CFG Scale设7 - 10,数值越高越贴合提示词,过高易失真。
    3. 生成与调试:输入提示词后点击“生成”按钮。若生成效果差,可调整提示词、更换模型,或微调采样步数、CFG Scale等参数,多次尝试就能找到合适设置。
  5. 入门拓展:图生图基础
    若想基于现有图片修改,可使用图生图功能:点击主界面“图生图”,上传参考图,调整“重绘幅度”(数值越低越接近原图,0.3 - 0.7较常用),再补充提示词,点击生成就能得到基于原图风格的新画面。
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐