DeepSeek+扣子Coze:1分钟生成xhs爆款单词视频,工作流(四)
该流程详细说明了如何通过数组循环生成两个视频:视频1将单词图片与固定音频合成;视频2则包含更多元素(单词、翻译、音标、例句等)并与合成的多段音频组合。主要步骤包括:循环处理数组数据、将文本转为图片、格式转换、语音合成、音频拼接,最后通过付费插件将图片与音频合成为视频。整个流程涉及多个技术节点,包括数据格式转换、文本转图片、语音合成及视频合成等操作。注意事项包含字体适配问题和付费插件的使用限制。
【二、生成视频1】
6、循环
循环类型是【使用数组循环】,即数组有几组,则循环几次。
输入是第2步【生成单词数组】节点的输出。
输出参数在循环体介绍完之后再介绍。

下面介绍循环体内的节点。
6-1将数组变量打散为单个变量
循环体内第1个节点是一个大模型,输入引用循环的【循环数组】,将数组内的变量拆分成一个个单独的string变量,不再是数组形式。目的是方便后续直接引用单个变量。更多给力项目免费下载,访问:AI创变工坊

提示词:
将{{input.yingwen}}输出到变量yingwen,将{{input.zhongwen}}输出到变量zhongwen,将{{input.yinbiao}}输出到变量yinbiao,将{{input.juzi_yingwen}}输出到变量juzi_yingwen,将{{input.juzi_zhongwen}}输出到变量juzi_zhongwen,其他不要做任何输出。

6-2进入生图工作流
进入【一、创建生图工作流】。

输入中文翻译、图片风格。如狮子、真实风格。
该工作流输出是用户确认满意的图片url。

6-3裁剪:上一步图片url转图片
上一步图片输出是一个url,是string格式,不能直接放到画板里,需要先转成image格式输出,因此增加一个裁剪节点,将string格式转成image格式。

6-4图1:将图片放到背景上
效果如下:

输入上一步生成的单词图片,在画板上进行布局。
输出就得到了图1:将图片放到背景图上。

6-5视频1:图1+音频1合成视频
图1 ok后,音频1是固定的,所以可以将这二者合为一个视频了。效果如下:
[p (1).mp4]
上一步得到了图1,需要将固定的音频1与图1合成一个视频。
音频1固定,提前做好:https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/72dc4fadc3714fa19db05b12e7a3ba22.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770187907&x-signature=odyvradLQ2bGZUj3OgCZ3oRhs%2F8%3D&x-wf-file_name=mix_05s+%28audio-joiner.com%29.mp3

选择下面这个插件。

在插件中输入前2个参数:图1、音频1。

可以看到输入中x-api-key非必填,每天有10000词共享调用,如果调用用完了,就不能用了,那么选择以下插件,该插件需要付费。每个视频预计花费几分钱至几毛钱,可以先充5元试试。
(ps:视频合成需要占用云服务器资源,所以需要花钱。)

网址:https://ts.fyshark.com/#/my_wallet

这个节点完成后,就完成了视频1的制作,输出变量videoUrl是视频地址。
【三、生成视频2】
6-6视频2生成过程:
效果如下:
[p (2).mp4]
这个过程有8步,依次看一下。
6-6-1音标转图片
音标在画板中不能直接展示,会出现异常符号(如下),原因是扣子的字体目前暂未适配音标。

所以采用文字转图片的插件,将音标先转成图片,再放入画板。

6-6-2裁剪2:上一步图片url转图片
上一步图片输出是一个url,是string格式,不能直接放到画板里,需要先转成image格式输出,因此增加一个裁剪节点,将string格式转成image格式。

6-6-3图2:展示所有信息
复制图1画板(重要!否则导致图片错位),在画板1的基础上,将5个元素(单词、中文翻译、音标、英文句子、中文句子)加上。


6-6-4单词转语音
选择【语音合成】插件,将单词转为语音。

6-6-5英语句子转语音
选择【语音合成】插件,将英语句子转为语音。

6-6-6将多段语音组成数组
将单词的音频和句子音频组成数组,用于下一步将这些音频拼接。
数组包括:单词音频3遍、句子一遍、再加转场音效。
转场音效固定,提前做好:https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3


提示词:
将{{yingwen}}{{juzi_yingwen}}{{qiehuan}}输出为一个数组,数组里有5个string,前3个string的值都与{{yingwen}}保持一致,第4个string的值与{{juzi_yingwen}}保持一致。第5个string的值是{{qiehuan}}。举例,
如果3个输入依次是:张三,喝水,https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3
则输出是["张三", "张三", "张三" ,"喝水","https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3"]
6-6-7音频2:合并多段语音
选择音频合并插件,将上一步得到的数组合并为音频,输出mp3

6-6-8视频2:图2+音频2合成视频
将图2、音频2都ok了,将二者合并为视频,将该节点结果输出循环。
这个插件与【视频1:图1+音频1合成视频】选择的插件一致。

[p (3).mp4]
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)