我们在写视频文案时经常需要参考别人的视频文案,此时就需要把别人的视频文案提取出来。我在网上找到了这样一个开源的语音识别AI大模型。用它可以把音频或者视频里的语音转换成文字提取出来。

相比于在线提取文案的付费网站,它有几个优点

一、它是本地运行的,把它安装到你的电脑上后可以永久免费使用,稳定发挥。有些网站虽然可以通过看广告免费使用,但是我们工作时的注意力是很宝贵的,每次被一个广告强行打断30秒,再想续上之前的心流状态就比较难,时间长了,比每个月付几十块会员费的代价还高

二、它是离线运行的,可以保密音频或视频

三、它没有音频或视频的文件大小和时长的限制

像常见的抖音、西瓜视频、小红书、哔哩哔哩等平台的视频文案,可以用在线视频下载器这个网站把视频或音频下载下来,然后用上文提到的语音识别模型把文案提取出来

假如某些网站的视频这个在线视频下载器不支持下载的话,可以用录音软件或者录屏软件把视频里说的话录下来,然后用这个语音识别AI模型把文案提取出来。

这个语音识别AI模型被我整合到了下图的AI工具箱中,它极大的简化了开源大模型的安装和使用。

AI 工具箱https://pan.quark.cn/s/c60d2e8c6a8e这个 AI 工具箱整合了做自媒体常用的几个AI大模型,有数字人(对口型)、AI翻唱、消除字幕、文生图、语音降噪、语音分离、人声分离、文案提取、识别字幕等。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐