解放双手!ChatTTS-ui烹饪助手:让AI语音带你轻松做出米其林大餐

【免费下载链接】ChatTTS-ui 匹配ChatTTS的web界面和api接口 【免费下载链接】ChatTTS-ui 项目地址: https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui

你还在烹饪时手忙脚乱地翻看手机菜谱?油锅里的菜快糊了,屏幕上的步骤却还没找到?现在,ChatTTS-ui烹饪助手来了!这个由ChatTTS-ui驱动的智能语音引导系统,能让你彻底告别烹饪时的"手忙脚乱",只需聆听AI语音指令,就能轻松完成从备菜到出锅的全过程。

读完本文,你将学会:

  • 如何搭建专属的语音菜谱系统
  • 怎样将任意菜谱转换为语音引导脚本
  • 自定义调节AI语音的语速、停顿和情感
  • 解决常见的语音合成问题

系统架构:厨房里的AI语音助手

ChatTTS-ui烹饪助手基于ChatTTS-ui的核心技术构建,主要由以下模块组成:

  • Web界面templates/index.html提供直观的交互界面,可输入菜谱文本并设置语音参数
  • 语音合成核心ChatTTS/core.py实现文本到语音的转换
  • API接口app.py提供后端服务,支持HTTP请求调用
  • 前端交互static/js/包含页面交互逻辑和语音播放控制

系统架构

快速上手:3步搭建你的语音菜谱系统

1. 环境准备

首先确保你的系统已安装以下依赖:

2. 安装部署

通过以下命令快速部署ChatTTS-ui:

git clone https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui.git chat-tts-ui
cd chat-tts-ui
python -m venv venv
source ./venv/bin/activate  # Linux/Mac
# 或 .\venv\scripts\activate (Windows)
pip install -r requirements.txt
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118  # GPU加速
python app.py

3. 下载模型文件

首次运行时系统会自动下载所需模型。若下载失败,可手动下载:

下载后将所有pt文件复制到asset目录下,重启服务即可。

制作你的第一份语音菜谱

菜谱文本格式

为获得最佳语音效果,建议使用以下格式编写菜谱:

[oral_2]欢迎使用ChatTTS烹饪助手!今天我们来做一道香煎三文鱼。[break_4]

[step_1]准备食材:[break_2]三文鱼排2块,盐1小勺,黑胡椒少许,橄榄油2勺,柠檬半个。[break_6]

[step_2]处理三文鱼:[break_2]用厨房纸吸干三文鱼表面水分,撒上盐和黑胡椒腌制10分钟。[laugh_0][break_8]

[step_3]煎制过程:[break_2]平底锅中倒入橄榄油,中火加热至5成热。[break_4]放入三文鱼,皮朝下煎3分钟。[break_4]翻面再煎2分钟至表面金黄。[break_6]

[step_4]完成装盘:[break_2]将煎好的三文鱼盛入盘中,挤上柠檬汁即可享用。[oral_0][break_4]

其中:

  • [break_X] 表示停顿X个单位时间
  • [laugh_0] 插入笑声增强亲和力
  • [oral_X] 调整口语化程度

使用Web界面生成语音

  1. 打开浏览器访问 http://127.0.0.1:9966
  2. 在文本框中粘贴格式化后的菜谱文本
  3. 设置语音参数:
    • 音色:建议选择2222(温柔女声)或7869(沉稳男声)
    • 语速:0.8-1.2之间调整
    • 停顿强度:0.6-0.8
  4. 点击"合成语音"按钮
  5. 生成完成后,点击播放按钮即可聆听

Web界面使用

通过API集成到其他应用

如果想将语音菜谱功能集成到你的烹饪APP中,可以使用API接口

import requests

def generate_cooking_guide(recipe_text):
    url = "http://127.0.0.1:9966/tts"
    data = {
        "text": recipe_text,
        "voice": 2222,  # 温柔女声
        "prompt": "[oral_2][break_4]",
        "temperature": 0.4,
        "top_p": 0.7,
        "top_k": 20
    }
    response = requests.post(url, data=data)
    return response.json()

# 使用示例
recipe = "[step_1]准备食材:三文鱼排2块..."
result = generate_cooking_guide(recipe)
print(f"语音文件URL: {result['audio_files'][0]['url']}")

高级技巧:打造专业级语音菜谱

音色选择与定制

ChatTTS-ui提供多种预设音色,适合不同类型的菜谱:

音色值 特点 适用场景
2222 温柔女声 甜点、家常菜
7869 沉稳男声 烧烤、烘焙
6653 活泼女声 儿童菜谱
4099 成熟男声 高级料理
5099 亲切女声 快手菜

你还可以通过cover-pt.py工具自定义音色,生成独特的语音风格。

情感调节与节奏控制

通过调整以下参数,可以让语音更富有情感和节奏感:

  • temperature:控制语音的随机性(0.1-1.0),较低值更稳定
  • top_p:控制语音的多样性(0.5-1.0),较高值变化更多
  • prompt:使用控制符如[laugh_0]添加笑声,[break_6]控制停顿

例如,为烘焙菜谱添加更多情感:

[oral_3][laugh_1]欢迎来到甜蜜烘焙时间![break_3]今天我们要做一个[emph]巧克力蛋糕[/emph]。[break_5]

多语言支持

ChatTTS-ui支持中英文混合文本,非常适合国际化菜谱:

将200克flour(面粉)、5克baking powder(泡打粉)和一小勺salt(盐)混合均匀。[break_4]
然后加入100克sugar(糖)和2个eggs(鸡蛋)。[break_3]

常见问题解决

语音合成失败或速度慢

  • 问题:执行app.py时提示缺少文件或CUDA错误
  • 解决:确保已安装CUDA 11.8+并正确配置,参考常见问题与报错第7、9条

生成的语音不自然

  • 问题:语音停顿不当或情感不足
  • 解决:调整temperature参数至0.3-0.5,添加适当的[break_X]控制符

中文数字转换问题

  • 问题:数字"123"被读作"一二三"而非"一百二十三"
  • 解决:在ChatTTS/utils/io_utils.py中调整数字转换逻辑

模型下载失败

  • 问题:无法从modelscope下载模型
  • 解决:关闭代理后重试,或手动下载模型文件

应用场景拓展

除了烹饪助手,ChatTTS-ui还可用于:

  • 有声书制作:将烹饪书籍转换为音频
  • 厨房教学:制作专业的烹饪教学语音内容
  • 餐厅服务:为顾客提供语音版菜单和菜品介绍
  • 食品工业:生产线语音指导和安全提示

总结与展望

ChatTTS-ui烹饪助手通过强大的语音合成技术,彻底解放了烹饪过程中的双手,让你专注于食材本身而非菜谱阅读。随着技术的发展,未来我们还将加入:

  • 语音识别功能,支持语音控制和步骤跳转
  • 菜谱数据库,提供海量预制语音菜谱
  • AR结合,实现虚拟厨师与语音引导的完美融合

立即开始使用ChatTTS-ui,让AI语音助手带你探索烹饪的无限可能!如有任何问题,欢迎查阅常见问题与报错或提交反馈。

提示:点赞收藏本文,下次烹饪时即可快速查阅搭建指南!

【免费下载链接】ChatTTS-ui 匹配ChatTTS的web界面和api接口 【免费下载链接】ChatTTS-ui 项目地址: https://gitcode.com/GitHub_Trending/ch/ChatTTS-ui

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐