‍‍‍‍‍前 言

腾讯最近悄咪咪的,突然就放了一个王炸,开源了一款130亿参数的AI视频大模型,这应该是目前世界上参数最大的开源视频大模型了。

3 号刚推出的时候也着实被最低 45G 的显存吓了一跳,这完全不给消费级显卡机会呀!

不过开源社区永远超级给力,隔了一天就把显存降到了 16G 以下,并且已经开发了对应 ComfyUI 插件,让我们可以直接在本地进行体验了,感谢 Kijai 大佬。

我尝试了下,效果超级不错,应该是目前文生视频领域的 NO1 了。

好了,话不多说,我们直接开整。

先来看下效果,这里使用的工具是 ComfyUI

提示词:Close up shot, a boy stretches out his right hand and happily stroked the head of a Border Collie.

除了手有点瑕疵,其它都很真实了有么有!其实多抽几次卡,手的问题也可以解决。

提示词:Static camera, a model wearing a vibrant red silk dress, the dress should have a glossy appearance, and the smooth, shiny texture of the silk should be clearly visible as the model moves.

这个用例之前几个视频大模型都试了,但是感觉效果都不太行,混元总算是让我发出来了。

提示词:The camera circles around a chinese woman dancer, capturing the fluidity of their movements and the contrast between their dynamic motion and the stationary environment.

舞蹈也总算是可以看看了。

提示词:A cat is running on the grassland, and the camera switches to a smiling little girl

转场衔接的也很不错。

提示词:A close-up shot of a young woman's face during sunset, with soft lighting highlighting her features. Her eyes well up with tears, and her lips quiver slightly, revealing suppressed emotions. The camera gradually zooms in, emphasizing the fine details of her face, finally focusing on her tear-filled eyes.

提示词的理解能力也是相当不错的。

提示词:The camera captures a asian man in a workplace reacting to unfair treatment, showcasing the subtle expressions of frustration and injustice.

表情输出也很到位,这表情很真实啊有么有!

提示词:纪录片风格,写实,中景,写字楼内,有很多工位,坐在工位上是一群猕猴,在电脑面前敲代码,镜头平移,特写猕猴们思考,疑惑,焦躁的表情

模型是支持中文提示词的,所以我们也可以直接写中文提示词。

这猴子的动作表情有点传神是什么情况。。。

提示词:动画风格,日落时分宁静的热带海滩,轻柔的海浪拍打着海岸,棕榈树在微风中摇曳,远处还有舒适的海滨小屋。

而且支持多种风格,不仅可以输出写实风格,还可以输出动画风格。

提示词:动画风格,斜侧特写,一个短发女孩蜷缩在飘窗榻榻米上,身边散落着几本翻开的漫画。她穿着宽松的白色T恤,上面印着EVA机甲图案,怀里抱着一只轻松熊玩偶。特写她专注的侧脸,嘴角随着剧情时而上扬。房间里,动漫海报贴满墙面,书架上整齐排列着手办模型。

好了,就先展示这么多吧。

接下来我们来看看具体如何使用,插件暂时还没有收录到 ComfyUI 管理器中,所以需要我们手动下载,插件也会放在我们的网盘里,需要的小伙伴自取。

插件地址:

工作流如下,其中的「HunyuanVideo BlockSwap」节点是用来降低显存,可以把显存降低到 16G 以内,要是本地显存够大的话可以删除这个节点。

现在默认是生成 512*320 分辨率的视频,显存限制暂时生成不了更高分辨率的视频,等后续优化吧。

再来说下这个节点,「attention mode」虽然有多个选项,但是暂时能用的就「sageattn varlen」,想要使用的话需要额外安装一些环境依赖

总的体验下来,我觉得整体的效果还是相当不错的,不管是提示词的理解能力,还是画面的真实感都相当不错,人物的表情细节也很到位。

而且视频的生成速度也不慢,4090 生成一个 16 帧率 5 秒的视频不到 2 分钟。生成一个 10 秒的视频也才 3.5 分钟。

这里提一下,模型对于视频生成的长度没有限制。10 秒的视频依旧很连贯,更长的暂时还没有试。

好了,今天的分享就到这里了,感兴趣的小伙伴快去试试吧!

模型以及工作流放在网盘里了,需要的小伙伴自取:

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉12000+AI关键词大合集👈

在这里插入图片描述

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐