当前很多ComfyUI工作流的应用都是基于4090显卡来执行的,对于大部分的文生图场景,无论是4090和3090的性能都是足够的。

这里主要测试Wan2.2的文生视频场景下4090和3090两张显卡的性能表现。

Wan (通义万相) 2.2是当前比较火的文生视频大模型,ComfyUI最新版本已经预置了Wan2.2的多个模板,如文生视频、图生视频、视频人物替换等:
ComfyUI内置Wan工作流模板

这里基于ComfyUI预置的Wan2.2模型工作流模板来测试在3090和4090两张显卡的性能表现。

晨涧云 算力租赁平台使用 Wan-ComfyUI 镜像分别创建 3090 和 4090 的显卡实例进行测试。

选择工作流

这里选择ComfyUI预置的「视频生成」模板中Wan2.2的第一个模板 Wan2.2 14B T2V 测试14B模型的文生视频应用。打开后工作流是长这样的:
ComfyUI Wan T2V 工作流

点击 「运行」,会生成一个5秒的视频:

wan2.2 14B t2v

然后我们写一个Python脚本来调用ComfyUI的API,通过工作流自动生成视频,并通过多次调用取平均的方式来统计比较3090和4090执行性能的差异,以及对显卡资源的占用情况。

3090测试

3090显卡ComfyUI Wan工作流测试

4090测试

4090显卡ComfyUI Wan工作流测试

测试结果解释

这里每个测试都跑了5次,取平均视频生成的耗时时长;同时记录显卡的显存和GPU使用情况,3090和4090两张显卡的显存使用和GPU利用率都比较接近。

从测试结果看,3090生成5秒Wan示例视频的平均耗时在142.6秒,4090的平均耗时在59.4秒,3090生成视频的耗时是4090的2.4倍左右,所以,4090在文生视频场景下的性能表现明显优于3090,基本与显卡参数的算力数据差距一致。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐