干货分享|DeepSeek辅助出图
搜索并添加“SDXLPreview风格化提示词”和“文本联结”节点,在“文本联结”节点的“分隔符”中输入英文逗号,然后把text1输入端口连接到“SDXLPreview风格化提示词”节点的“正面条件”输出端口。把“文本联结”节点的“字符串”输出端口连接到“CLIP文本编码器”节点,如下图所示。我们先测试一下反推提示词的质量,忽略“采样输出”和“高清放大”分组框,创建“展示文本”节点后将其连接到“J
语义分割和提示词反推功能是让工作流自动运行的基础条件,以后搭建的大多数实用工作流都要用到这两个模块。语义分割抠取的区域越精确,提示词反推的描述文字越准确,生成结果的质量就越高。
Flux模型具有很强的提示词理解能力,同时对提示词的要求也很高。虽然我们可以用自然语言输入提示词,但要想得到更好的生成结果,仍然需要从风格画质、角色服饰、环境背景、镜头构图等角度进行描述。对于不太擅长编写提示词的用户来说,使用大模型辅助是一个很好的解决方案。本节将把当前非常热门的DeepSeek模型集成到ComfyUI中,利用这个模型反推和扩写提示词。
步骤01
打开“02文生图/FLUX-优化文生图”工作流,在“中文提示词”节点上右击,在弹出的快捷菜单中选择“转换为输入/Convert text to input”命令,将文本输入框转换为输入端口。搜索并添加“Janus Image Understanding”节点,把新建节点的输出端口连接到“中文提示词”节点上,如下图所示。

步骤02
从“Janus Image Understanding”节点的model输入端口拖出连线,创建“Janus Model Loader”节点,然后把这两个节点的processor端口连接起来。接下来从“Janus Image Understanding”节点的image输入端口拖连线,创建“加载图像”节点,然后载入参考图,如下图所示。

提示
在“Janus Model Loader”节点的model_name菜单中可以选择deepseek-ai/Janus-pro-1B和deepseek-ai/Janus-pro-7B两个模型,其中7B模型的质量更高,但需要占用大量显存资源。对于反推提示词和提示词润色来说,使用1B模型足以满足需求。
步骤03
这样工作流就改造完成了。我们先测试一下反推提示词的质量,忽略“采样输出”和“高清放大”分组框,创建“展示文本”节点后将其连接到“Janus Image Understanding”节点的输出端口,运行工作流就能看到反推出来的文本。
步骤04
在“Janus Image Understanding”节点的文本框中,默认已经写好了提示语,如果想用中文查看结果,可以在提示语后面加上“用中文输出”,如下图所示。

步骤05
接下来,我们用反推出来的提示词生成图像。开启“采样输出”分组框,在“空Latent”节点中设置生成尺寸后运行工作流,生成结果如下图所示。可以看到,生成结果的内容与参考图一致,由此可以证明DeepSeek的反推能力和Flux模型的理解能力。

步骤06
除了反推提示词以外,DeepSeek模型还可以扩写和润色提示词。比如我们想画一个跳舞的女孩,可以在“Janus Image Understanding”节点中输入以下提示语:
根据我输入的AI绘画提示词进行专业润色和扩写,用英文输出结果,从人物形象、人物动作、环境、整体色调进行描述,描写非常详细,只输出结果,以下是我的AI绘画提示词:一个跳舞的女孩。
步骤07
为了避免参考图产生干扰,我们上传一幅纯色图像。运行工作流后,DeepSeek模型就会根据要求替我们扩写提示词,并生成高质量的图像,如下图所示。

步骤08
当前的工作流还可以继续优化。搜索并添加“SDXLPreview风格化提示词”和“文本联结”节点,在“文本联结”节点的“分隔符”中输入英文逗号,然后把text1输入端口连接到“SDXLPreview风格化提示词”节点的“正面条件”输出端口。把“文本联结”节点的“字符串”输出端口连接到“CLIP文本编码器”节点,如下图所示。

步骤09
把“Janus Image Understanding”节点的输出端口连接到“文本联结”节点的“text2”输入端口。现在,我们只需在“SDXLPreview风格化提示词”节点的“风格”菜单中选择一种艺术形式或者风格,就能轻松生成不同风格的图像,如下图所示。

本篇文章到此结束啦,其他更多知识请关注我不迷路哦!
本文摘自《AI摄影与创意设计:Stable Diffusion-ComfyUI 》,具体内容请以书籍为准。
AI摄影与创意设计:Stable Diffusion-ComfyUI——jd
https://item.jd.com/14541669.html

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)