推荐轻量级文生视频模型(Text-to-Video)
HuggingFace + ModelScope CLI 接口友好。:一句文字描述(如:"a panda is dancing"):8GB~16GB 显存(支持 CPU fallback):2秒视频(16帧,576x320 分辨率):约 40~120 秒(满足你的要求)真正文生视频(非插帧)
·
1. ModelScope T2V by 阿里达摩院(推荐)
-
模型名:
damo/text-to-video-synthesis -
输入:一句文字描述(如:"a panda is dancing")
-
输出:2秒视频(16帧,576x320 分辨率)
-
显卡推荐:8GB~16GB 显存(支持 CPU fallback)
-
生成时间:约 40~120 秒(满足你的要求)
-
优点:
-
真正文生视频(非插帧)
-
HuggingFace + ModelScope CLI 接口友好
-
-
开源地址:
-
在线示例:https://modelscope.cn/models/damo/text-to-video-synthesis/summary
-
使用方式(简化):
pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)