即使学习了性能更优的BoTSORT,学习StrongSORT仍然非常有必要
strongsort的简要概括
《StrongSORT: 让 DeepSORT 再创辉煌》—— 技术深度解析
一篇于2023年发表在《IEEE Transactions on Multimedia》期刊上的研究论文,通过重新审视并大幅改进经典的多目标跟踪(MOT)算法DeepSORT,显著推动了该领域的发展。这项名为“StrongSORT: Make DeepSORT Great Again”的研究,推出了StrongSORT跟踪器,为多目标跟踪社区建立了一个全新的、更强大的公平比较基准。该研究还通过两个新颖的轻量级算法——无外观链接模型(AFLink)和高斯平滑插值(GSI)——进一步增强了其性能,这两个算法与StrongSORT结合后,诞生了达到业界顶尖水平的StrongSORT++。
该论文的作者包括来自北京邮电大学和交互技术与体验系统重点实验室的杜云浩、赵志成、宋阳、赵燕云、苏飞,以及来自上海人工智能实验室的宫韬和来自英国布鲁内尔大学的孟鸿鹰。论文的初版于2022年2月提交至学术论文预印本网站arXiv。
核心创新:AFLink 与 GSI
该论文的重大贡献在于提出了两种“即插即用”的轻量级算法,旨在解决多目标跟踪中的两个固有难题:
- 无外观链接模型 (AFLink): 为了解决“关联丢失”(即同一目标的轨迹被打碎成多个片段)的问题,AFLink提供了一种全局关联的方法。与许多依赖于高计算复杂度的外观信息的方法不同,AFLink仅利用时空数据来判断两个轨迹片段是否属于同一个目标。这种“无外观”的特性使其在速度和精度之间取得了更好的平衡。
- 高斯平滑插值 (GSI): 为了解决由遮挡或低分辨率等原因造成的“检测丢失”问题,该论文提出了GSI算法。该技术利用高斯过程回归来插值预测丢失目标的边界框,它将目标的运动信息也考虑在内,而这正是传统的线性插值方法所忽略的。
这两个模块都非常轻量,可以轻松地集成到各种跟踪器中,而只会带来微不足道的额外计算开销。
顶尖的性能表现
StrongSORT和StrongSORT++的有效性在多个公开基准数据集(包括MOT17、MOT20、DanceTrack和KITTI)上得到了充分验证。实验结果表明,StrongSORT++取得了顶尖的性能,尤其是在HOTA(高阶跟踪精度)和IDF1(身份F1分数)等关键指标上。
- 在充满挑战的MOT17数据集上,StrongSORT++的HOTA达到了64.4%,IDF1为79.5%,MOTA(多目标跟踪精度)为79.6%。
- 在更为拥挤的MOT20基准测试中,其HOTA为62.6%,IDF1为77.0%。
论文强调,这些结果相较于基线的DeepSORT和其他同期先进的跟踪器有了显著的提升。集成了AFLink和GSI的最终版跟踪器StrongSORT++,在这些基准测试的排行榜上始终名列前茅。
| 特性 | StrongSORT / StrongSORT++ | BoTSORT |
|---|---|---|
| 核心思想 | DeepSORT的现代化升级版,是经典范式的集大成者。 | ByteTrack与卡尔曼滤波的融合,是极简主义的巅峰。 |
| 外观信息 | 核心依赖,使用强大的Re-ID模型。 | 几乎不依赖,只在最后作为补充或完全不用。 |
| 关键组件 | YOLOX检测器、BoT Re-ID模型、NSA卡尔曼滤波、ECC、AFLink、GSI。 | 卡尔曼滤波、ByteTrack的数据关联策略(高低分框匹配)。 |
| 性能表现 | 性能优异,尤其是在HOTA和IDF1指标上,关联准确性高。 | SOTA级别,尤其在MOTA和处理遮挡上表现突出,速度更快。 |
| 适用场景 | 需要长时重识别、目标外观差异明显的场景。 | 极度拥挤、频繁遮挡、目标外观相似的场景。 |
| 学习价值 | 理解基于外观的跟踪范式,学习多模块系统的构建和优化。 | 理解数据关联和匹配策略的重要性,学习如何用简单工具解决复杂问题。 |
结论:
学习了BoTSORT,再回头学习StrongSORT,非但不是浪费时间,反而能让你建立起对多目标跟踪领域更全面、更深刻的认知。你会明白为什么有些方法要用Re-ID,而有些方法不用;它们各自的优劣是什么,以及它们是如何在不同的问题假设下,殊途同归地达到了顶尖的性能。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)