北数云|语音驱动照片生成视频
本文介绍了北数云平台上使用语音驱动照片生成视频的详细操作流程:1)新建项目并配置镜像、数据和计算资源;2)拷贝代码到指定目录并验证;3)启动UI程序并开放7860端口;4)通过无痕浏览器访问视频制作网站;5)选择示例素材并生成视频。文末提醒用户及时关闭开发环境以避免额外费用,建议设置自动停止功能。
北电云入门指南(十)手把手教你用语音驱动照片生成视频
创建项目
点击工作台右上角 创建项目 新建项目。
初始化配置
按照下图推荐配置,选择镜像、数据及模型
资源配置:P1.large及以上,算力较低可能会带来更大的系统延迟,影响您的使用体验,若您选择更高配置,请您确保您有足够的算力点
镜像:选择EchoMimic-v1.0
数据:选择Echomimic_code
模型:暂无
代码拷贝
cd到data-1目录下,执行以下指令,将代码拷贝到/gemini/code/目录下
运行以下指令,观察返回的大小,若在 20G 左右,亦可验证cp成功 du -sh /gemini/code
程序启动
顺序执行以下程序启动命令,运行时间较长,请耐心等待
cd /gemini/code # 进入启动目录
bash run.sh # 启动UI程序
启动成功后,终端会出现大量输出,不必理会,直到系统暴露端口号7860
点击右上角端口tab,点击添加端口按钮,输入端口号7860和使用用途,建议填写“外部访问”,点击确定即可
点击确定后,右侧会展示外部访问链接:复制链接备用
访问视频制作网站
打开无痕浏览器模式,复制刚刚粘贴的链接地址,即可访问视频制作网站,下图是使用教程
您可以在快速选择示例区选择为您准备好的一些备选图片与音频,选择后可以在窗口中预览与试听
点击生成按钮后,返回终端可以看到图片与视频维度与生成进度,时间较长请您耐心等待
温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用。如果担心自己忘记关闭,可以提前在右边栏配置处设置自动停止时间。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)