能说方言会唱歌,阶跃星辰 Step-Audio-TTS-3B 在线体验上线模力方舟
阶跃星辰开源的Step-Audio-TTS-3B文本转语音模型正式上线模力方舟Serverless API,用户可通过在线链接直接体验。作为业界首个基于LLM-Chat范式训练的大规模合成语音模型,Step-Audio-TTS-3B在SEED TTS Eval基准测试中取得SOTA成绩,支持多语言、情感表达及多样语音风格控制,并创新性实现说唱、哼唱生成功能。文章展示了其方言(如四川话)、名人音色(
阶跃星辰开源的文本转语音模型
Step-Audio-TTS-3B现已上线模力方舟 Serverless API,访问以下连接即可体验使用:https://ai.gitee.com/serverless-api?model=Step-Audio-TTS-3B

Step-Audio-TTS-3B是业界首个基于大规模合成数据集并采用 LLM-Chat 范式训练的文本转语音(TTS)模型。该模型在SEED TTS Eval基准测试中取得了SOTA(最先进的)字符错误率成绩。

内容一致性的表现对比中,Step-Audio-TTS-3B的中英文 CER(字符错误率)和 WER(词错误率)均表现出色
Step-Audio-TTS-3B支持多种语言、丰富的情感表达以及多样的语音风格控制。特别值得注意的是,Step-Audio-TTS-3B也是业界首个能够生成说唱和哼唱的 TTS 模型。
点击文末阅读原文,前往模力方舟体验Step-Audio-TTS-3B吧!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)