不可思议!效果超逼真的图片转说话视频,批量生成操作,秘籍在此!
阿里云百炼,一站式大模型开发与应用构建平台。无论是开发者,还是业务人员,皆能深度参与大模型应用的设计搭建。借助简洁界面操作,开发者 5 分钟可开发大模型应用,几小时就能训练专属模型,得以将更多心力投入应用创新之中。模型很丰富。
阿里云百炼,一站式大模型开发与应用构建平台。无论是开发者,还是业务人员,皆能深度参与大模型应用的设计搭建。借助简洁界面操作,开发者 5 分钟可开发大模型应用,几小时就能训练专属模型,得以将更多心力投入应用创新之中。
模型很丰富

先先看效果。
本次我们用的是【悦动人像EMO】

效果还是挺逼真的。
操作步骤
1、登录阿里云百炼平台
https://bailian.console.aliyun.com/#/home
2、设置API-KEY

3、调用检查图像接口-得到图像【检查参数】
EMO图像检测API_大模型服务平台百炼(Model Studio)-阿里云帮助中心
emo-detect-v1
emo-detect-v1是一个特定的图像检测模型,用于检测输入的图片是否满足emo模型所需的人物肖像图片规范。
4、提交生成视频请求(需要用到上一步的【检查参数】)获取任务ID
5、通过任务ID获取视频
这个是收费的API-但有免费的时长

4、调用视频生成接口-使用3得到图像【检查参数】
HTTP调用接口
功能描述
用于生成人物头像、半身像动态视频。不推荐用于生成人物全身像动态视频。
前提条件
已开通服务并获得API-KEY:获取API Key。
输入图像已通过EMO图像检测API检测,并获得对应人脸区域和动态区域的范围值作为入参。
得到任务ID
{"output": {"task_id": "a8532587-fa8c-4ef8-82be-0c46b17950d1",
"task_status": "PENDING"}"request_id": "7574ee8f-38a3-4b1e-9280-11c33ab46e51"}
5、通过任务ID请求真正的视频地址
请求示例
curl -X GET \
--header 'Authorization: Bearer <YOUR_API_KEY>' \
https://dashscope.aliyuncs.com/api/v1/tasks/<YOUR_TASK_ID>
响应示例(作业成功执行完毕)
{"output":{"task_id":"a8532587-fa8c-4ef8-82be-0c46b17950d1","task_status":"SUCCEEDED","results":{"video_url":"https://xxx/1.mp4"}},"usage":{"video_duration": 10.23,"video_ratio": "1:1"},"request_id":"7574ee8f-38a3-4b1e-9280-11c33ab46e51"}
6、计费形式

趁着现在有免费次数,赶紧去试一试吧。
1800秒。也就是半个小时的视频,也够玩一会儿了。
PS:官方案例提供的是bash的代码。可以让ai转为Python的代码。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)