效果视频:

基于SenseVoice和QT的AI语音录入软件,支持本地部署

 


🔍 它能做什么?

只需对着麦克风说话,程序就能实时将你的语音转换为文字,并自动填入文本框中,全程无需联网

✅ 支持中文语音高精度识别
✅ 基于阿里开源的 SenseVoice 语音模型,识别准确率和稳定性都非常出色
本地运行,数据不上传,隐私安全有保障
✅ 轻量级设计,部署简单,支持嵌入到其他项目中
✅ 特别适合医疗、法律、教育、会议记录等需要大量文本录入的场景


💡 实际应用场景举例:

比如医生在接诊时,只需口述:“患者,男,35岁,主诉头痛三天,伴有恶心……”
系统就能实时生成结构化文本,省去手动输入的繁琐,效率提升不止一倍!

再也不用担心录音资料“积压成山”,也避免了因打字分心而遗漏关键信息。


🚀 技术亮点:

  • 使用 SenseVoice Small 模型进行语音识别,本地推理,响应快
  • 基于 Python + Qt5 开发,界面简洁,跨平台运行(Windows / Linux / macOS)
  • 支持自定义热键启动录音,操作流畅
  • 完全开源,代码清晰,易于二次开发和集成

🌐 项目已开源!

👉 GitHub 地址:https://github.com/FlyMercurian/VoiceInputQt

 

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐