不懂就问QQ: 507143199

1. mod_ali_nls.so模块中集成了TTS播放,ASR识别

2. 使用FreeSWITCH标准的speak或playback:say,指定tts_engine, tts_voice即可完成文字的播放

3. 同时使用放音ivr, play_and_get_digits等都可以使用tts放音.

4. TTS还支持SSML高级复合文本的播放

5. TTS播放支持缓存, 重复的文本不再重复实时合成

6. ASR为实时语音识别,识别过程产生speech(开始说话), detected(产生识别结果), detected_timeout(识别超时)事件

配置如下:

<configuration name="ali_nls.conf" description="ali nls Configuration">
    <settings>
        <!-- 阿里语音识别请求地址 -->
        <param name="nls_url" value="ws://nls-gateway.cn-shanghai-internal.aliyuncs.com/ws/v1"/>
        <!-- 阿里云语音识别日志级别(LogError 1, LogWarning 2, LogInfo 3, LogDebug 4) -->
        <param name="log-level" value="4"/>
        <!-- 阿里云语音识别appkey -->
        <param name="appkey" value="xxxxxxxxxxxxx"/>
        <!-- 阿里云语音识别key-id -->
        <param name="access-key-id" value="xxxxxxxxxxxxxxxxxxxxxx"/>
        <!-- 阿里云语音识别key-secret -->
        <param name="access-key-secret" value="xxxxxxxxxxxxxxxxxxxxxx"/>
        <!-- 阿里云请求并发数, 200以下使用1, 以上用4 -->
        <param name="pool-events" value="1"/>
        <!-- 最大识别说话时长(ms) -->
        <param name="max-speech-timeout" value="20000"/>
        <!-- 单个TTS语音合成缓存初始值, 单位B -->
        <param name="buffer-size" value="4096000"/>
        <!-- 单个TTS语音合成缓存最大值,单位B -->
        <param name="buffer-max-size" value="8192000"/>
        <!-- 服务启动时生效,重载无用,最大缓存TTS合成语音个数,缓存几句话(voice_volume_speech_rate_pitch_rate_xxxx) -->
        <param name="max-cache-size" value="1000"/>
    </settings>
</configuration>

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐