自定义训练Azure语音识别服务

Mr_YangYang8

1298人浏览 · 2025-02-08 16:39:15

Mr_YangYang8 · 2025-02-08 16:39:15 发布

在Azure AI Foundry中对ASR语音识别进行fine tuning

前言
一、自定义语音识别是什么？
二、使用步骤
- 1.登录Azure并创建AI Foundry项目
- 2.创建AI服务微调
训练结果对比
- 通用模型

前言

Azure的Speech服务大家可能都不陌生，但是统一的Azure Speech to text有时候对一些企业、特殊行业的名词识别效果表现不佳，这时候需要我们对其模型进行微调以适用于不同的场景。

一、自定义语音识别是什么？

自定义语音识别，你可以上传自己的数据、测试和训练自定义模型、比较模型之间的准确度，以及将模型部署到自定义终结点。
图片来自于Azure文档

二、使用步骤

1.登录Azure并创建AI Foundry项目

Azure地址：portal.azure.com

①进入AI Foundry界面

创建AI Foundary

②创建AI中心

创建AI中心

③在AI中心中创建对应的AI项目

创建AI项目

④项目创建完成以后，点击跳转到studio界面

进入Studio

2.创建AI服务微调

①创建AI服务微调
在这里插入图片描述

②添加训练集，根据自己需求选择上传的训练数据类型
在这里插入图片描述

③选择训练集，进行训练。

在这里插入图片描述

④测试模型

在这里插入图片描述
⑤模型部署

训练结果对比

实际文本:北京云馥信息科技作为微软合作伙伴，拥有微软认证专业技术团队，我们致力于提供各式云端应用解决方案，作为云端解决方案服务提供商CSP(Cloud Solution Provider)及云端管理服务提供商MSP(Managed Service Provider)，我们针对客户各项应用需求提供客制化的云端服务解决方案，并且协助客户上云之前进行架构咨询与评估、安全建议与检查、拟定执行迁移计划、容灾备份、提供客户上云之后资源代管与监控、7x24小时技术支持、定期提供客户资源检查与架构优化建议报告，服务的客户横跨媒体、游戏、电商零售、制造、汽车、金融等行业。

通用模型

识别为北京云复
在这里插入图片描述
经过微调训练后的模型

可以正确识别转换出特定文本
在这里插入图片描述

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

cover

Codex 完整使用教程（Windows/macOS 双系统区别详解）

智能体开发者社区

[智能体-640]：Openclaw自动实时备份workspace空间中的内容到gitee仓库的本质与步骤

OpenClaw 的 workspace 是存放全部智能体配置资产的核心目录，包含 SOUL.md、AGENTS.md、技能配置、记忆日志、业务流程、自然语言编排脚本等整套数字公司核心资产，是硅基组织的全部源代码与经营档案。自动实时备份至 Gitee，本质是一套内置轻量化 Git 自动化调度链路：依托智能体引擎内置Git 客户端、定时 / 事件触发器监控 workspace 文件变动，自动执行完整

智能体开发者社区

cover

从 0 吃透 Transformer：大模型背后的核心结构，一篇讲清

智能体开发者社区

所有评论(0)

查看更多评论

Mr_YangYang8

已为社区贡献2条内容