Weipeng Studio.

YOLO 的损失函数

字数统计: 400阅读时长: 1 min
2020/11/13 Share

需要理解下图坐标、置信度和分类参数意义

img

网络最末端的卷积层输出的15×15大小的特征图,每一个像素的每一个通道都代表了一个输出指标。

损失函数

img

损失函数分为三部分,分别是BBox误差损失、IOU误差损失和类概率损失,重点需要理解IOU损失。

注意求和的范围是每一个最终7乘7或15乘15的格子上的所有anchor

BBox损失

带有λcoord的部分,坐标位置采用均方误差,宽高采用开根号后的均方误差。

前面的1obj表示该单元格是否负责预测目标,是的话为1,否为0.

原因是由于作者认为小的BBOX偏差大的话带来的精度影响大于同等大小偏差下的大的BBOX的偏差,因此开根号中和这种影响。

IOU(置信度)损失

带有Ci的损失项,Cij=Pr(Object)∗IOU,表示该anchor的置信度

  1. 对于负责预测的格子,计算其预测与GT的IOU损失

  2. 对于不负责的格子,找到所有置信小于阈值(如0.5或0.3)的格子,由于一幅图上负样本较多,前面加上权重系数λnoobj很小,防止负样本的损失贡献太大使得正样本的损失被忽略,导致网络训练不好。这一步只在网络初始训练时使用,中期末期可以忽略这一步。

分类损失

很好理解,就是类别的onehot向量均方损失。

CATALOG
  1. 1. 需要理解下图坐标、置信度和分类参数意义
  2. 2. 损失函数
    1. 2.1. BBox损失
    2. 2.2. IOU(置信度)损失
    3. 2.3. 分类损失