怎么提取视频文字？

qq_30339671

441人浏览 · 2025-08-26 14:05:42

qq_30339671 · 2025-08-26 14:05:42 发布

我们在写视频文案时经常需要参考别人的视频文案，此时就需要把别人的视频文案提取出来。我在网上找到了这样一个开源的语音识别AI大模型。用它可以把音频或者视频里的语音转换成文字提取出来。

相比于在线提取文案的付费网站，它有几个优点

一、它是本地运行的，把它安装到你的电脑上后可以永久免费使用，稳定发挥。有些网站虽然可以通过看广告免费使用，但是我们工作时的注意力是很宝贵的，每次被一个广告强行打断30秒，再想续上之前的心流状态就比较难，时间长了，比每个月付几十块会员费的代价还高

二、它是离线运行的，可以保密音频或视频

三、它没有音频或视频的文件大小和时长的限制

像常见的抖音、西瓜视频、小红书、哔哩哔哩等平台的视频文案，可以用在线视频下载器这个网站把视频或音频下载下来，然后用上文提到的语音识别模型把文案提取出来

假如某些网站的视频这个在线视频下载器不支持下载的话，可以用录音软件或者录屏软件把视频里说的话录下来，然后用这个语音识别AI模型把文案提取出来。

这个语音识别AI模型被我整合到了下图的AI工具箱中，它极大的简化了开源大模型的安装和使用。

AI 工具箱https://pan.quark.cn/s/c60d2e8c6a8e这个 AI 工具箱整合了做自媒体常用的几个AI大模型，有数字人（对口型）、AI翻唱、消除字幕、文生图、语音降噪、语音分离、人声分离、文案提取、识别字幕等。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

制造数据与AI践行者老蒋的技术博客全系列文章汇总（持续更新）

这是作者的专栏文章导航总台账，持续更新AI智能体、本地化AI落地、Python实战等系列内容。作者为20年IT老兵，聚焦制造业AI应用，分享RAG知识库、Agent智能体开发、Python工程化工具等实战经验。目前已发布多篇技术文章，包括本地大模型部署、AI客服系统搭建、亲子编程案例等，所有案例均提供可复用的工程源码。文章按核心主线分类展示，并附更新日志，建议读者关注收藏，不迷路，后续经常内容不断

智能体开发者社区

跨境常用：账单表格批量处理，每天省20+小时工作量 | 企业级AI Agent自动化选型指南

智能体开发者社区

Agent Guard：给 AI 编程助手做一次环境合规体检

AI 编程 Agent 越来越好用，平台风控也越来越严。封号很少只因为「翻墙」，更常见的是本机环境里的细微信号：代理泄漏、时区指纹不一致、客户端配置残留、MCP 明文密钥……覆盖主流工具：Claude Code、Cursor、Codex、Gemini、Windsurf、Hermes。Agent Guard 专注这件事：在你电脑本地做 AI Agent 环境合规检测与修复。打开即可扫描本机风险项。发