下面是详细的介绍和公式解释,结合刚才生成的图例帮助你更好地理解 mAPFPSIoU 这三个目标检测的评测指标。


在这里插入图片描述
在这里插入图片描述

1. mAP (mean Average Precision)

mAP 是衡量目标检测模型在多个类别上的整体表现的一个指标,结合了 Precision(精度)和 Recall(召回率)。

(1) Precision 和 Recall
  • Precision(精度):在所有预测为正类(物体)的框中,实际正确的框占的比例。公式如下:

    Precision=真正例数 (TP)预测为正类的框总数 (TP + FP) Precision = \frac{\text{真正例数 (TP)}}{\text{预测为正类的框总数 (TP + FP)}} Precision=预测为正类的框总数 (TP + FP)真正例数 (TP)

    • TP(True Positive)是正确预测的框。
    • FP(False Positive)是错误预测的框。
  • Recall(召回率):在所有实际为正类(物体)的框中,模型能够正确检测出的框占的比例。公式如下:

    Recall=真正例数 (TP)实际为正类的框总数 (TP + FN) Recall = \frac{\text{真正例数 (TP)}}{\text{实际为正类的框总数 (TP + FN)}} Recall=实际为正类的框总数 (TP + FN)真正例数 (TP)

    • FN(False Negative)是漏掉的框。
(2) Precision-Recall 曲线

通过在不同阈值下计算 PrecisionRecall,我们可以绘制 Precision-Recall (PR) 曲线。如图所示,蓝色曲线展示了 RecallPrecision 的关系,随着 Recall 的提高,Precision 通常会下降。

  • AP (Average Precision)Precision-Recall 曲线 下的面积。简单来说,AP越高,模型表现越好。

在我们的示例中,计算的 AP = 0.85

(3) mAP (mean Average Precision)

mAP 是所有类别 AP 的平均值,表示模型在多个类别上的综合表现。

例如,如果有三种类别,分别计算得出的 AP 值如下:

  • 狗的 AP = 0.85
  • 猫的 AP = 0.75
  • 车的 AP = 0.90

那么,mAP 计算为:

mAP=0.85+0.75+0.903=0.83 mAP = \frac{0.85 + 0.75 + 0.90}{3} = 0.83 mAP=30.85+0.75+0.90=0.83


2. FPS (Frames Per Second)

FPS 用来衡量目标检测模型处理图像的速度,表示模型每秒能处理多少张图像。高 FPS 表示模型更快。

(1) FPS 的定义和公式

如果模型每张图像处理的时间是 T 秒,那么 FPS 就是每秒处理的图像数量,公式如下:

FPS=1T FPS = \frac{1}{T} FPS=T1

例如,如果每张图像处理的时间是 0.05 秒,那么 FPS = \frac{1}{0.05} = 20

(2) FPS 和处理时间的关系

图示中显示了 FPS 与每帧处理时间的关系。随着 FPS 提高,处理每帧图像的时间减少。这意味着模型处理速度越快,适合实时检测任务。


3. IoU (Intersection over Union)

IoU 用来衡量目标检测模型在定位物体时的准确性,它表示预测框与真实框之间的重叠程度。

(1) IoU 的公式

IoU 是通过计算预测框与真实框的交集部分与并集部分的比值来得到的,公式如下:

IoU=预测框与真实框的交集面积预测框与真实框的并集面积 IoU = \frac{\text{预测框与真实框的交集面积}}{\text{预测框与真实框的并集面积}} IoU=预测框与真实框的并集面积预测框与真实框的交集面积

  • 交集面积:预测框和真实框重叠的区域。
  • 并集面积:预测框和真实框覆盖的总区域。
(2) IoU 的作用
  • IoU 值范围是从 0 到 1,IoU = 1 表示完全重叠,IoU = 0 表示没有重叠。
  • 在目标检测中,通常设定一个 IoU 阈值(如 0.5),如果 IoU > 0.5,则认为预测框是正确的。

在我们的示例中,计算的 IoU = 0.40,这意味着预测框和真实框的重叠程度较低。


总结

  • mAP(mean Average Precision):反映了模型在多个类别上的整体表现,越高表示模型的综合表现越好。
  • FPS(Frames Per Second):衡量模型处理图像的速度,越高表示模型越快速,适合实时检测。
  • IoU(Intersection over Union):衡量模型在定位物体时的准确性,越高表示预测框与真实框的重叠程度越大,定位越准确。

希望通过这些图示和解释,能够帮助你更好地理解目标检测中的评测指标!

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐