开源字幕生成工具SmartSub:视频语音识别及字幕生成
摘要:介绍开源字幕生成工具SmartSub,支持跨平台批量生成视频/音频字幕并进行翻译。文章详细说明安装步骤(需匹配CUDA版本)、使用流程(模型选择、API配置、CUDA加速建议)以及字幕合成方法(推荐剪映)。该工具支持多种翻译服务,最终输出.srt字幕文件。项目地址和软件包下载链接已提供。(149字)
前言:
近些天尝试查找中文语音视频生成英文字幕的开源方案,发现一款方便实用的开源项目SmartSub,现在分享给大家!
开源项目Smart介绍:是一款跨平台客户端工具,可以批量为视频或者音频生成字幕文件,并支持对字幕进行翻译,支持百度、火山、openai、ollama、deepseek 等多家翻译
项目地址:https://github.com/buxuku/SmartSub
软件包地址:https://github.com/buxuku/SmartSub/releases
一、下载和安装
1.首先根据电脑显卡参数确定需要下载的软件版本。以Nvidia显卡为例,可通过CMD输入"nvidia-smi"命令查看,笔者的CUDA版本为12.6。

2.选择匹配的版本下载

3.下载后按默认安装即可

二、软件使用步骤,生成字幕文件
1.打开软件,下载模型,模型按照如下建议进行选择,这里笔者常用模型large-v3-turbo-q8_0


2.如需进行翻译,需要配置翻译服务API

翻译服务API申请方式参照该项目Github上面的介绍( https://bobtranslate.com/service/ )

3.以上步骤完成之后,即可开始视频语音字幕识别及字幕翻译工作
建议:任务开始前推荐开启使用CUDA加速,这样任务执行速度将比默认使用CPU快很多

设置源音视频文件及翻译设置后,再开始执行任务


任务执行结束后,点击校对后保存,在源音视频同目录文件夹中可获取到生成的.srt字幕文件

三、使用视频剪辑工具将原视频及Srt字幕合成(笔者使用剪映软件合成)

以上为本次分享的内容,如有问题,欢迎沟通交流,谢谢!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)