开源字幕生成工具SmartSub：视频语音识别及字幕生成

摘要：介绍开源字幕生成工具SmartSub，支持跨平台批量生成视频/音频字幕并进行翻译。文章详细说明安装步骤（需匹配CUDA版本）、使用流程（模型选择、API配置、CUDA加速建议）以及字幕合成方法（推荐剪映）。该工具支持多种翻译服务，最终输出.srt字幕文件。项目地址和软件包下载链接已提供。（149字）

wait me

765人浏览 · 2025-12-01 01:00:31

wait me · 2025-12-01 01:00:31 发布

前言：

近些天尝试查找中文语音视频生成英文字幕的开源方案，发现一款方便实用的开源项目SmartSub，现在分享给大家！

开源项目Smart介绍：是一款跨平台客户端工具，可以批量为视频或者音频生成字幕文件，并支持对字幕进行翻译，支持百度、火山、openai、ollama、deepseek 等多家翻译

项目地址：https://github.com/buxuku/SmartSub

软件包地址：https://github.com/buxuku/SmartSub/releases

一、下载和安装

1.首先根据电脑显卡参数确定需要下载的软件版本。以Nvidia显卡为例，可通过CMD输入"nvidia-smi"命令查看，笔者的CUDA版本为12.6。

2.选择匹配的版本下载

3.下载后按默认安装即可

二、软件使用步骤，生成字幕文件

1.打开软件，下载模型，模型按照如下建议进行选择，这里笔者常用模型large-v3-turbo-q8_0

2.如需进行翻译，需要配置翻译服务API

翻译服务API申请方式参照该项目Github上面的介绍（ https://bobtranslate.com/service/ ）

3.以上步骤完成之后，即可开始视频语音字幕识别及字幕翻译工作

建议：任务开始前推荐开启使用CUDA加速，这样任务执行速度将比默认使用CPU快很多

设置源音视频文件及翻译设置后，再开始执行任务

任务执行结束后，点击校对后保存，在源音视频同目录文件夹中可获取到生成的.srt字幕文件

三、使用视频剪辑工具将原视频及Srt字幕合成（笔者使用剪映软件合成）

以上为本次分享的内容，如有问题，欢迎沟通交流，谢谢！

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla