开源项目:FlyCut Caption智能视频字幕裁剪工具
FlyCut Caption是一款智能字幕编辑工具,提供语音转文字、可视化编辑和视频预览功能。核心功能包括:基于Whisper模型的多语言语音识别、直观字幕编辑界面、实时视频同步播放、SRT/JSON多格式导出,以及字幕样式自定义。采用React19+TypeScript技术栈,支持HuggingFace本地AI处理,适配各类设备。安装需Node.js18+环境,通过pnpm/npm运行,支持MP
·
核心功能
- 🎤 智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
- ✂️ 可视化字幕编辑:直观的字幕片段选择和删除界面
- 🎬 实时视频预览:与字幕同步的视频播放器,支持区间播放
- 📤 多格式导出:支持 SRT、JSON 字幕格式以及视频文件导出
- 🎨 字幕样式定制:自定义字幕字体、颜色、位置等样式
- 🌐 国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)
🔧 技术特色
- ⚡ 现代化技术栈:React 19 + TypeScript + Vite + Tailwind CSS
- 🧠 本地 AI 处理:使用 Hugging Face Transformers.js 在浏览器本地运行 AI 模型
- 🎯 Web Workers:ASR 处理在后台线程运行,不阻塞主界面
- 📱 响应式设计:适配不同屏幕尺寸的现代化界面
- 🎪 组件化架构:模块化设计,易于维护和扩展
快速开始
环境要求
- Node.js 18+
- pnpm (推荐) 或 npm
安装步骤
- 克隆项目
git clone https://github.com/x007xyz/flycut-caption.git cd flycut-caption
- 安装依赖
pnpm install
- 启动开发服务器
pnpm dev
- 打开浏览器
http://localhost:5173
构建生产版本
# 构建项目 pnpm build # 预览构建结果 pnpm preview
📋 使用指南
1. 上传视频文件
- 支持格式:MP4, WebM, AVI, MOV
- 支持音频:MP3, WAV, OGG
- 拖拽文件到上传区域或点击选择文件
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐



所有评论(0)