解放双手!ChatTTS-ui烹饪助手:让AI语音带你轻松做出米其林大餐
你还在烹饪时手忙脚乱地翻看手机菜谱?油锅里的菜快糊了,屏幕上的步骤却还没找到?现在,ChatTTS-ui烹饪助手来了!这个由[ChatTTS-ui](https://link.gitcode.com/i/039a1a864e54f0517343995a3d5d7158)驱动的智能语音引导系统,能让你彻底告别烹饪时的"手忙脚乱",只需聆听AI语音指令,就能轻松完成从备菜到出锅的全过程。读完本文,
解放双手!ChatTTS-ui烹饪助手:让AI语音带你轻松做出米其林大餐
【免费下载链接】ChatTTS-ui 匹配ChatTTS的web界面和api接口 项目地址: https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui
你还在烹饪时手忙脚乱地翻看手机菜谱?油锅里的菜快糊了,屏幕上的步骤却还没找到?现在,ChatTTS-ui烹饪助手来了!这个由ChatTTS-ui驱动的智能语音引导系统,能让你彻底告别烹饪时的"手忙脚乱",只需聆听AI语音指令,就能轻松完成从备菜到出锅的全过程。
读完本文,你将学会:
- 如何搭建专属的语音菜谱系统
- 怎样将任意菜谱转换为语音引导脚本
- 自定义调节AI语音的语速、停顿和情感
- 解决常见的语音合成问题
系统架构:厨房里的AI语音助手
ChatTTS-ui烹饪助手基于ChatTTS-ui的核心技术构建,主要由以下模块组成:
- Web界面:templates/index.html提供直观的交互界面,可输入菜谱文本并设置语音参数
- 语音合成核心:ChatTTS/core.py实现文本到语音的转换
- API接口:app.py提供后端服务,支持HTTP请求调用
- 前端交互:static/js/包含页面交互逻辑和语音播放控制
快速上手:3步搭建你的语音菜谱系统
1. 环境准备
首先确保你的系统已安装以下依赖:
- Python 3.9-3.11环境
- ffmpeg音频处理工具(ffmpeg/ffmpeg下载.txt)
- Git版本控制工具
2. 安装部署
通过以下命令快速部署ChatTTS-ui:
git clone https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui.git chat-tts-ui
cd chat-tts-ui
python -m venv venv
source ./venv/bin/activate # Linux/Mac
# 或 .\venv\scripts\activate (Windows)
pip install -r requirements.txt
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118 # GPU加速
python app.py
3. 下载模型文件
首次运行时系统会自动下载所需模型。若下载失败,可手动下载:
- GitHub下载:all-models.7z
- 百度网盘:模型文件(提取码: ct5x)
下载后将所有pt文件复制到asset目录下,重启服务即可。
制作你的第一份语音菜谱
菜谱文本格式
为获得最佳语音效果,建议使用以下格式编写菜谱:
[oral_2]欢迎使用ChatTTS烹饪助手!今天我们来做一道香煎三文鱼。[break_4]
[step_1]准备食材:[break_2]三文鱼排2块,盐1小勺,黑胡椒少许,橄榄油2勺,柠檬半个。[break_6]
[step_2]处理三文鱼:[break_2]用厨房纸吸干三文鱼表面水分,撒上盐和黑胡椒腌制10分钟。[laugh_0][break_8]
[step_3]煎制过程:[break_2]平底锅中倒入橄榄油,中火加热至5成热。[break_4]放入三文鱼,皮朝下煎3分钟。[break_4]翻面再煎2分钟至表面金黄。[break_6]
[step_4]完成装盘:[break_2]将煎好的三文鱼盛入盘中,挤上柠檬汁即可享用。[oral_0][break_4]
其中:
[break_X]表示停顿X个单位时间[laugh_0]插入笑声增强亲和力[oral_X]调整口语化程度
使用Web界面生成语音
- 打开浏览器访问 http://127.0.0.1:9966
- 在文本框中粘贴格式化后的菜谱文本
- 设置语音参数:
- 音色:建议选择2222(温柔女声)或7869(沉稳男声)
- 语速:0.8-1.2之间调整
- 停顿强度:0.6-0.8
- 点击"合成语音"按钮
- 生成完成后,点击播放按钮即可聆听
通过API集成到其他应用
如果想将语音菜谱功能集成到你的烹饪APP中,可以使用API接口:
import requests
def generate_cooking_guide(recipe_text):
url = "http://127.0.0.1:9966/tts"
data = {
"text": recipe_text,
"voice": 2222, # 温柔女声
"prompt": "[oral_2][break_4]",
"temperature": 0.4,
"top_p": 0.7,
"top_k": 20
}
response = requests.post(url, data=data)
return response.json()
# 使用示例
recipe = "[step_1]准备食材:三文鱼排2块..."
result = generate_cooking_guide(recipe)
print(f"语音文件URL: {result['audio_files'][0]['url']}")
高级技巧:打造专业级语音菜谱
音色选择与定制
ChatTTS-ui提供多种预设音色,适合不同类型的菜谱:
| 音色值 | 特点 | 适用场景 |
|---|---|---|
| 2222 | 温柔女声 | 甜点、家常菜 |
| 7869 | 沉稳男声 | 烧烤、烘焙 |
| 6653 | 活泼女声 | 儿童菜谱 |
| 4099 | 成熟男声 | 高级料理 |
| 5099 | 亲切女声 | 快手菜 |
你还可以通过cover-pt.py工具自定义音色,生成独特的语音风格。
情感调节与节奏控制
通过调整以下参数,可以让语音更富有情感和节奏感:
temperature:控制语音的随机性(0.1-1.0),较低值更稳定top_p:控制语音的多样性(0.5-1.0),较高值变化更多prompt:使用控制符如[laugh_0]添加笑声,[break_6]控制停顿
例如,为烘焙菜谱添加更多情感:
[oral_3][laugh_1]欢迎来到甜蜜烘焙时间![break_3]今天我们要做一个[emph]巧克力蛋糕[/emph]。[break_5]
多语言支持
ChatTTS-ui支持中英文混合文本,非常适合国际化菜谱:
将200克flour(面粉)、5克baking powder(泡打粉)和一小勺salt(盐)混合均匀。[break_4]
然后加入100克sugar(糖)和2个eggs(鸡蛋)。[break_3]
常见问题解决
语音合成失败或速度慢
- 问题:执行app.py时提示缺少文件或CUDA错误
- 解决:确保已安装CUDA 11.8+并正确配置,参考常见问题与报错第7、9条
生成的语音不自然
- 问题:语音停顿不当或情感不足
- 解决:调整temperature参数至0.3-0.5,添加适当的[break_X]控制符
中文数字转换问题
- 问题:数字"123"被读作"一二三"而非"一百二十三"
- 解决:在ChatTTS/utils/io_utils.py中调整数字转换逻辑
模型下载失败
- 问题:无法从modelscope下载模型
- 解决:关闭代理后重试,或手动下载模型文件
应用场景拓展
除了烹饪助手,ChatTTS-ui还可用于:
- 有声书制作:将烹饪书籍转换为音频
- 厨房教学:制作专业的烹饪教学语音内容
- 餐厅服务:为顾客提供语音版菜单和菜品介绍
- 食品工业:生产线语音指导和安全提示
总结与展望
ChatTTS-ui烹饪助手通过强大的语音合成技术,彻底解放了烹饪过程中的双手,让你专注于食材本身而非菜谱阅读。随着技术的发展,未来我们还将加入:
- 语音识别功能,支持语音控制和步骤跳转
- 菜谱数据库,提供海量预制语音菜谱
- AR结合,实现虚拟厨师与语音引导的完美融合
立即开始使用ChatTTS-ui,让AI语音助手带你探索烹饪的无限可能!如有任何问题,欢迎查阅常见问题与报错或提交反馈。
提示:点赞收藏本文,下次烹饪时即可快速查阅搭建指南!
【免费下载链接】ChatTTS-ui 匹配ChatTTS的web界面和api接口 项目地址: https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)