SongGeneration 是腾讯 AI Lab开源的音乐生成大模型,只需要输入歌词,选择生成音乐风格,即可一键生成各种曲风的高质量歌曲。
SongGeneration 相比之前的 DiffRhythm和 ACE-Step ,显著提升了音质表现,生成歌曲的准确度相较部分商业闭源模型表现出相当甚至更优的质量,同时在整体表现、旋律、伴奏、音质与结构等维度也优于现有多数同类模型。

SongGeneration 应该是目前开源歌曲生成效果里,最好的模型(截至目前),生成歌曲甚至开源媲美商业软件Suno。


SongGeneration 优点很多,缺点也很直接,就是对硬件要求高,生成时间略长。
官方原版生成90秒歌曲大概需要28G显存,我在原版的基础上做了部分优化和参数调优,在生成质量没有明显降低的同时,显存16G即可完成生成任务,但相对时间也较长。


应用领域

音乐创作‌: 对于音乐创作者来说,SongGeneration可以作为灵感来源,帮助他们快速生成音乐素材,或者作为辅助工具,完善和优化他们的音乐作品。
音乐教育‌: 在音乐教学中,教师可以利用SongGeneration生成不同难度和风格的音乐练习曲,帮助学生更好地理解和掌握音乐知识。
游戏与影视‌: 游戏和影视行业需要大量的背景音乐和音效,SongGeneration可以根据场景需求快速生成合适的音乐,提高制作效率和作品质量。
个性化音乐推荐‌: 结合用户的音乐偏好和历史行为数据,SongGeneration可以生成个性化的音乐作品推荐,提升用户的音乐体验。


使用教程:(建议N卡,显存16G起。支持50系显卡,基于CUDA12.8)

输入歌词,选择曲风,比如流行,摇滚,爵士等,一键生成即可。默认不自带模型,首次运行会自动下载,模型较大,耐心等待。
同时支持输入参考音乐和文字提示词生成。

文本控制:用户仅需输入关键词文本(如 “开心 流行”、“激烈 摇滚”)即可实现风格与情绪控制,SongGeneration 会基于输入文本生成高质量的完整音乐作品。  
风格跟随:用户可自行上传 10 秒以上的参考音频,SongGeneration 会自动生成风格一致的全长新曲,覆盖流行、摇滚、中国风、“神曲” 等多种流派。生成歌曲在保持风格一致性的同时,拥有较好的音乐性表现。

下载地址:私信领取

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐