【二、生成视频1】

6、循环

循环类型是【使用数组循环】,即数组有几组,则循环几次。

输入是第2步【生成单词数组】节点的输出。

输出参数在循环体介绍完之后再介绍。

下面介绍循环体内的节点。

6-1将数组变量打散为单个变量

循环体内第1个节点是一个大模型,输入引用循环的【循环数组】,将数组内的变量拆分成一个个单独的string变量,不再是数组形式。目的是方便后续直接引用单个变量。更多给力项目免费下载,访问:AI创变工坊

提示词:

将{{input.yingwen}}输出到变量yingwen,将{{input.zhongwen}}输出到变量zhongwen,将{{input.yinbiao}}输出到变量yinbiao,将{{input.juzi_yingwen}}输出到变量juzi_yingwen,将{{input.juzi_zhongwen}}输出到变量juzi_zhongwen,其他不要做任何输出。

6-2进入生图工作流

进入【一、创建生图工作流】。

输入中文翻译、图片风格。如狮子、真实风格。

该工作流输出是用户确认满意的图片url。

6-3裁剪:上一步图片url转图片

上一步图片输出是一个url,是string格式,不能直接放到画板里,需要先转成image格式输出,因此增加一个裁剪节点,将string格式转成image格式。

6-4图1:将图片放到背景上

效果如下:

输入上一步生成的单词图片,在画板上进行布局。

输出就得到了图1:将图片放到背景图上。

6-5视频1:图1+音频1合成视频

图1 ok后,音频1是固定的,所以可以将这二者合为一个视频了。效果如下:

[p (1).mp4]

上一步得到了图1,需要将固定的音频1与图1合成一个视频。

音频1固定,提前做好:https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/72dc4fadc3714fa19db05b12e7a3ba22.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770187907&x-signature=odyvradLQ2bGZUj3OgCZ3oRhs%2F8%3D&x-wf-file_name=mix_05s+%28audio-joiner.com%29.mp3

选择下面这个插件。

在插件中输入前2个参数:图1、音频1。

可以看到输入中x-api-key非必填,每天有10000词共享调用,如果调用用完了,就不能用了,那么选择以下插件,该插件需要付费。每个视频预计花费几分钱至几毛钱,可以先充5元试试。

(ps:视频合成需要占用云服务器资源,所以需要花钱。)

网址:https://ts.fyshark.com/#/my_wallet

这个节点完成后,就完成了视频1的制作,输出变量videoUrl是视频地址。

【三、生成视频2】

6-6视频2生成过程:

效果如下:

[p (2).mp4]

这个过程有8步,依次看一下。

6-6-1音标转图片

音标在画板中不能直接展示,会出现异常符号(如下),原因是扣子的字体目前暂未适配音标。

所以采用文字转图片的插件,将音标先转成图片,再放入画板。

6-6-2裁剪2:上一步图片url转图片

上一步图片输出是一个url,是string格式,不能直接放到画板里,需要先转成image格式输出,因此增加一个裁剪节点,将string格式转成image格式。

6-6-3图2:展示所有信息

复制图1画板(重要!否则导致图片错位),在画板1的基础上,将5个元素(单词、中文翻译、音标、英文句子、中文句子)加上。

6-6-4单词转语音

选择【语音合成】插件,将单词转为语音。

6-6-5英语句子转语音

选择【语音合成】插件,将英语句子转为语音。

6-6-6将多段语音组成数组

将单词的音频和句子音频组成数组,用于下一步将这些音频拼接。

数组包括:单词音频3遍、句子一遍、再加转场音效。

转场音效固定,提前做好:https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3

提示词:

将{{yingwen}}{{juzi_yingwen}}{{qiehuan}}输出为一个数组,数组里有5个string,前3个string的值都与{{yingwen}}保持一致,第4个string的值与{{juzi_yingwen}}保持一致。第5个string的值是{{qiehuan}}。举例,

如果3个输入依次是:张三,喝水,https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3

则输出是["张三", "张三", "张三" ,"喝水","https://p3-bot-workflow-sign.byteimg.com/tos-cn-i-mdko3gqilj/31611695e64e4ae39f701153a2fb99a5.mp3~tplv-mdko3gqilj-image.image?rk3s=81d4c505&x-expires=1770188192&x-signature=xrfi9wj0YyDHODqcZuV4ck9%2BMi4%3D&x-wf-file_name=%E5%88%87%E5%9C%BA%E6%99%AF+%28mp3cut.net%29.mp3"]

6-6-7音频2:合并多段语音

选择音频合并插件,将上一步得到的数组合并为音频,输出mp3

6-6-8视频2:图2+音频2合成视频

将图2、音频2都ok了,将二者合并为视频,将该节点结果输出循环。

这个插件与【视频1:图1+音频1合成视频】选择的插件一致。

[p (3).mp4]

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐