FunASR学术论文引用完整指南:如何正确引用Paraformer语音识别模型

【免费下载链接】FunASR A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc. 【免费下载链接】FunASR 项目地址: https://gitcode.com/GitHub_Trending/fun/FunASR

FunASR(Fundamental End-to-End Speech Recognition Toolkit)是一个强大的端到端语音识别工具包,提供业界领先的开源预训练模型,支持语音识别、语音活动检测、文本后处理等功能。本文将详细介绍如何正确在学术论文中引用FunASR项目及其核心的Paraformer模型。

📚 Paraformer论文基本信息

Paraformer(Parallel Transformer)是FunASR工具包中的代表性非自回归端到端语音识别模型,具有高精度、高效率、便捷部署的优点。该模型支持快速构建语音识别服务,是语音识别领域的重要突破。

核心论文引用格式

@article{gao2022paraformer,
  title={Paraformer: Fast and Accurate Parallel Transformer for Non-autoregressive End-to-End Speech Recognition},
  author={Gao, Zhifu and Zhang, Shiliang and McLoughlin, Ian and Yan, Zhijie},
  journal={arXiv preprint arXiv:2206.08317},
  year={2022}
}

🔍 相关衍生模型引用

除了基础的Paraformer模型,FunASR还提供了多个衍生版本,每个都有对应的学术论文需要正确引用:

SeACo-Paraformer热词定制模型

@article{zhang2023seaco,
  title={SeACo-Paraformer: A Non-Autoregressive ASR System with Flexible and Effective Hotword Customization Ability},
  author={Zhang, Binbin and Wu, Di and Peng, Zhendong and Song, Xingchen and Yao, Zhuoyuan and Lv, Hang and Xie, Lei and Yang, Chao and Pan, Fuping and Niu, Jianwei},
  journal={arXiv preprint arXiv:2308.03266},
  year={2023}

📖 其他相关论文引用

FunASR生态系统包含多个相关技术,以下是一些重要的引用文献:

UniASR统一语音识别框架

@article{gao2023uniasr,
  title={UniASR: Unified Speech Recognition Models with Jointly Optimized Modules},
  author={Gao, Zhifu and Zhang, Shiliang and Yan, Zhijie and McLoughlin, Ian},
  journal={arXiv preprint arXiv:2305.14751},
  year={2023}

SenseVoice多语言语音识别

@article{sensevoice2024,
  title={SenseVoice: Multi-Language Speech Recognition and Translation Model},
  author={FunASR Team},
  journal={Technical Report},
  year={2024}

💡 正确引用实践建议

1. 区分模型版本

在引用时请明确注明使用的具体模型版本:

  • Paraformer-large(通用版本)
  • Paraformer-long(长语音优化版本)
  • Paraformer-Spk(说话人分离版本)

2. 注明数据集信息

如果使用了特定的训练数据集,请在方法部分说明:

  • 使用ModelScope或HuggingFace上的预训练模型
  • 训练数据规模和语言种类
  • 具体的模型配置参数

3. 版本控制说明

建议在论文中注明使用的FunASR版本号,确保实验结果的可重现性。

🎯 引用注意事项

  1. 双盲评审:在双盲评审过程中,避免在论文正文中透露作者机构信息
  2. 版本一致性:确保引用的论文版本与使用的代码版本相匹配
  3. 技术细节:在方法部分详细描述使用的具体配置和参数设置
  4. 对比实验:如果进行对比实验,请公平比较并注明对比条件

📊 常见引用错误避免

❌ 错误:仅引用GitHub仓库而不引用具体论文 ✅ 正确:同时引用原始论文和技术报告

❌ 错误:混淆不同版本的Paraformer模型 ✅ 正确:明确说明使用的具体模型变体

❌ 错误:忽略模型配置和参数细节 ✅ 正确:详细描述实验设置和模型配置

通过遵循本指南,您可以确保在学术论文中正确、规范地引用FunASR和Paraformer相关成果,为语音识别领域的研究提供准确的参考文献支持。

【免费下载链接】FunASR A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc. 【免费下载链接】FunASR 项目地址: https://gitcode.com/GitHub_Trending/fun/FunASR

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐