Timestep Type」选项(SigmoidLinearShiftWeighted)在 LoRA 训练器扩散模型微调 (Diffusion Fine-tuning) 里,主要决定了噪声时间步(timestep)在训练过程中如何被采样,也就是模型在不同去噪阶段学习的权重分布。
不同的分布策略会影响训练重点、模型风格以及收敛速度。

🧩 1️⃣ Linear(线性分布)

  • 描述:最常见、最均匀的方式,从低噪声到高噪声线性均匀采样。

  • 采样重点:所有噪声等级的时间步(t)被平等对待。

  • 优点:简单、稳定;适合通用任务(如风格微调、角色LoRA)。

  • 缺点:没有针对特定阶段优化。

📈 用途:默认推荐,用于大多数LoRA训练(尤其是SD 1.5、SDXL基础微调)。


🧩 2️⃣ Sigmoid(S型分布)

  • 描述:时间步的采样遵循S形曲线(sigmoid分布),在中间阶段采样较多。

  • 采样重点:强化模型在“中等噪声”阶段的去噪学习。

  • 优点:更平滑地学习细节结构(纹理、面部、布料等)。

  • 缺点:训练初期和高噪声阶段学习较少,可能导致泛化性下降。

📈 用途:适合风格微调或注重“质感细节”的LoRA(如油画、插画、摄影风)。


🧩 3️⃣ Shift(偏移分布)

  • 描述:时间步采样在某一侧偏移(通常偏低噪声区域)。

  • 采样重点:偏重去噪后期(低噪声),也就是生成图像细节更精细的阶段。

  • 优点:模型更容易学习细节特征与风格。

  • 缺点:泛化到高噪声阶段较弱,容易“记住”训练集(过拟合风险上升)。

📈 用途:适合训练“角色LoRA”、“服装LoRA”、“人脸LoRA”等以细节为主的任务。


🧩 4️⃣ Weighted(加权分布)

  • 描述:根据自定义权重函数或预设策略,对不同时间步给予不同权重。

  • 采样重点:可人为控制哪些噪声区间被重点训练。

  • 优点:灵活、可优化针对性任务(如高噪声适应或低噪声强化)。

  • 缺点:需要调参或理解底层采样逻辑,否则可能不稳定。

📈 用途:高级用户可用于实验性训练,比如特定风格(夜景、逆光、强光)或高噪声适配模型。

✅ 总结建议:

Timestep Type 特点 推荐用途
Linear 均匀采样,稳定 默认选择,通用LoRA
Sigmoid 中噪声权重高,细节好 插画/油画风格LoRA
Shift 偏低噪声,强化细节 人物、服装、面部LoRA
Weighted 自定义控制 进阶实验、特殊分布
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐