视频模型开发套件PaddleVideo

PaddleVideo是飞桨官方出品的视频模型开发套件，旨在为视频领域的学术研究和产业实践提供丰富的工具和模型支持。该项目基于模块化设计，提供了多种视频理解任务的解决方案，包括动作识别、视频分类、动作定位、动作检测等。PaddleVideo支持多种前沿算法，并打造了产业级特色模型PP-TSM和PP-TSMv2，同时打通了数据生产、模型训练、压缩、预测部署的全流程。PaddleVideo作为飞桨生态

mopmgerg54mo

1575人浏览 · 2025-09-24 14:35:30

mopmgerg54mo · 2025-09-24 14:35:30 发布

项目概述

核心特性

1. 丰富的模型库

PaddleVideo提供了多种先进的视频理解模型，包括：

PP-TSM：基于TSM（Temporal Shift Module）的高效动作识别模型
PP-TSMv2：轻量化行为识别模型，Kinetics-400精度75.16%，25fps的10s视频CPU推理时间仅需456ms
TokenShift：基于Transformer的行为识别模型
2s-ACGN、CTR-GCN：基于骨骼点的行为识别模型
YOWO：单阶段时空动作检测模型

2. 全流程支持

PaddleVideo支持从数据准备到模型部署的完整流程：

数据处理：提供视频抽帧、数据增强等工具
模型训练：支持多种训练策略，如知识蒸馏、模型压缩等
模型部署：支持Python预测引擎、C++预测引擎、服务端部署等多种方式

3. 产业级应用

PaddleVideo的应用场景覆盖多个行业：

体育：动作识别、赛事分析
互联网：视频内容推荐、智能封面生成
工业：异常行为检测、设备监控
医疗：医学影像分析、手术动作识别

安装指南

环境要求

Python 3.6+
PaddlePaddle 2.0+
其他依赖库：请参考requirements.txt

安装步骤

安装PaddlePaddle

# CPU版本
pip install paddlepaddle
# GPU版本
pip install paddlepaddle-gpu

克隆PaddleVideo仓库

git clone https://gitee.com/paddlepaddle/PaddleVideo.git
cd PaddleVideo

安装依赖

pip install -r requirements.txt

快速开始

模型训练

# 单卡训练
python main.py --config_file configs/recognition/pptsm/pptsm_k400_8frames.yaml

# 多卡训练
python -m paddle.distributed.launch --gpus="0,1,2,3" main.py --config_file configs/recognition/pptsm/pptsm_k400_8frames.yaml

模型推理

python tools/predict.py --input_file example.mp4 --model_name PP-TSMv2 --device cpu

模型部署

导出模型

python tools/export_model.py --config_file configs/recognition/pptsm/pptsm_k400_8frames.yaml --save_dir inference_model

启动服务

python deploy/python_serving/main.py --model_dir inference_model --device cpu

性能指标

PP-TSMv2模型性能

数据集	精度	模型大小	推理时间(CPU)
Kinetics-400	75.16%	22M	456ms/10s视频

与其他模型对比

模型	精度	推理速度
PP-TSM	74.38%	520ms/10s视频
PP-TSMv2	75.16%	456ms/10s视频
SlowFast	74.5%	2052ms/10s视频

总结

PaddleVideo作为飞桨生态中的重要组成部分，为视频理解任务提供了全面的解决方案。其丰富的模型库、高效的推理性能和便捷的部署方式，使其在学术研究和产业应用中都具有广泛的应用前景。随着持续的更新和优化，PaddleVideo将继续为开发者提供更加先进、易用的视频理解工具。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla

火山引擎 ADG 社区

所有评论(0)

查看更多评论

mopmgerg54mo

@mopmgerg54mo

已为社区贡献35条内容

视频模型开发套件PaddleVideo

mopmgerg54mo

项目概述

核心特性

1. 丰富的模型库

2. 全流程支持

3. 产业级应用

安装指南

环境要求

安装步骤

快速开始

模型训练

模型推理

模型部署

性能指标

PP-TSMv2模型性能

与其他模型对比

最新动态

2025年更新内容

总结

所有评论(0)

mopmgerg54mo

视频模型开发套件PaddleVideo

mopmgerg54mo

项目概述

核心特性

1. 丰富的模型库

2. 全流程支持

3. 产业级应用

安装指南

环境要求

安装步骤

快速开始

模型训练

模型推理

模型部署

性能指标

PP-TSMv2模型性能

与其他模型对比

最新动态

2025年更新内容

总结

所有评论(0)

温馨提示：您尚未绑定手机号

mopmgerg54mo