2 行代码,15 分钟部署对话式 AI Agent!丨社区来稿
基于开源框架 TEN Framework 构建,声网近日推出了最新的对话式 AI 引擎。这是一个「开箱即用」的对话式 AI 部署解决方案。2 行代码,15 分钟,即使像 DeepSeek 这样的文本大模型也能快速转变为对话式多模态大模型,具备能说会道的能力。通过官方 demo 网站,你可以体验到智能助手、情感陪伴、口语陪练、智能客服等多种对话式 AI 的使用场景。
基于开源框架 TEN Framework 构建,声网近日推出了最新的对话式 AI 引擎。这是一个「开箱即用」的对话式 AI 部署解决方案。2 行代码,15 分钟,即使像 DeepSeek 这样的文本大模型也能快速转变为对话式多模态大模型,具备能说会道的能力。
通过官方 demo 网站,你可以体验到智能助手、情感陪伴、口语陪练、智能客服等多种对话式 AI 的使用场景。
快来体验和 AI 实时对话
👇https://conversational-ai.shengwang.cn

Beta 测试阶段限时免费,更多产品介绍和文档:
https://www.shengwang.cn/ConversationalAI/
近期,DeepSeek 旋风席卷全球,其独有的深度思考+联网模式让用户纷纷惊叹好用,如果你想脱离与 AI 的文字互动,与 DeepSeek 进行更具真实感的语音对话,声网的对话式 AI 引擎让你15分钟内就能做到。
今天,声网对话式 AI 引擎 Beta 版也正式上线,支持开发者在 Console 后台自行开通服务接入 API,并在 Playground 中实际调参、测试并生成代码,仅需2行代码,15分钟即可部署基于大模型的对话式 AI Agent。
声网对话式 AI 引擎官网也已同步上线,开发者在了解产品功能的同时,也可通过官网申请体验最新的 Demo 应用。

5大能力让你的大模型能说会道
AI语音秒回: AI 秒回你的提问,语音对话延迟低至650ms
对话人声锁定: 屏蔽95%环境人声、噪声干扰,精准识别对话人声
智能打断: 模拟真人对话节奏,随时打断与 AI 的对话,响应低至340ms
全模型适配: 实现 DeepSeek、ChatGPT 等全模型适配,更有音视频 SDK 支持 30000+终端机型适配,解决多设备兼容性的后顾之忧
不惧弱网: 地铁、地下车库等弱网环境下,人与 AI 也能流畅对话
声网对话式 AI 引擎将为开发者带来极致的对话体验、极简的开发部署, 即使像 DeepSeek 这样的文本大模型也能快速转变为对话式多模态大模型,具备能说会道的能力 。同时,对话式 AI 引擎同样支持基于阿里云、腾讯云的稳定满血版 DeepSeek ,不用担心出现“服务器繁忙,请稍后再试”。

如何快速部署对话式 AI 引擎
开发者想要快速调用声网对话式 AI 引擎 RESTful API 实现与 AI 语音互动,根据以下流程就可通过2行代码,15分钟快速实现从打开 Console 后台到说『Hello Agent』,大幅降低开发门槛。
前提条件:
1、已在声网 Console 控制台开通服务,并获得 App ID、临时 Token、客户 ID 和客户密钥等信息。
2、已联系声网技术支持为你的项目开通声网对话式 AI 引擎。
3、你的 App 已实现基本的实时音视频功能。
4、已获取大模型提供商的 API key 和回调 URL。
5、已获取文本转语音 (TTS) 提供商的 API key。
满足以上前提条件,就可实现与 Agent 的语音互动。具体流程如下图所示:

总体来说部署流程分为三个核心步骤: 第一步:加入RTC频道 ,在你的 App 中调用『 joinChannel 』加入一个 RTC 频道。
第二步:创建对话式智能体 :调用『 创建对话式智能体』创建一个智能体实例,并传入上一步中使用的频道名和 Token 让智能体加入同一个 RTC 频道。完成该步骤后,声网会推荐你前往“控制台 - 对话式 AI 引擎 - Playground”快速体验与 AI 对话,正确配置各项参数并完成体验后,点击右上角的 View code 复制自动生成的服务端 API 调用示例代码。
第三步:停止对话式智能体 :结束对话后,调用『停止对话式智能体』,让智能体离开 RTC 频道。
更多具体的详细部署流程可点击查看官网的文档中心。
此外,声网对话式 AI 引擎 在 Beta 测试阶段限时免费,欢迎各行各业的开发者参与部署并与我们交流。同时,也可通过声网官网或下方的二维码,申请体验声网对话式 AI 引擎最新的 Demo 应用。


更多 Voice Agent 学习笔记:
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)