腾讯混元Custom视频生成模型，主体一致性效果达到开源SOTA？(附代码运行流程)

混元Custom模型在视频生成领域展现了卓越的能力，特别是在保持身份特征一致性和连贯性方面。该模型支持多种模态输入，包括文本、图像、音频和视频，为创作者提供了丰富的控制条件，以实现多样化的创意表达。目前，模型已开源单主体视频生成功能，用户只需上传一张主体图片并输入视频描述，模型便能识别图片中的身份信息，并生成在不同动作、服饰和场景中连贯自然的视频内容。这一功能为视频创作提供了极大的灵活性和创新空间

m0_37996323

642人浏览 · 2025-05-13 10:22:20

m0_37996323 · 2025-05-13 10:22:20 发布

在这里插入图片描述
根据官方资料，混元Custom模型在单人、非人物体、多主体交互等多种场景中，都能保持身份特征在视频全程的一致性与连贯性，避免“主体漂移”、“人物变脸” 等问题。

🔗详细内容请见本链接

该模型融合了文本、图像、音频、视频等多种模态输入，为视频生成提供丰富控制条件，创作者可依据需求灵活组合，实现多样化创意表达，呼应模型名称中的Custom一词。

🔗官网https://hunyuancustom.github.io/：
在这里插入图片描述
目前已开源单主体视频生成能力，即上传一张主体图片(比如一个人的照片)，然后给出视频描述的提示词，模型就能识别图片中的身份信息，在不同动作、服饰与场景中生成连贯自然的视频内容。

目前已开源单主体视频生成能力，即上传一张主体图片(比如一个人的照片)，然后给出视频描述的提示词，模型就能识别图片中的身份信息，在不同动作、服饰与场景中生成连贯自然的视频内容。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla