2020-06-30 10:04:14

目标检测与损失函数

目标检测

识别图片中有哪些物体以及物体的位置

输入原图

image.png

结果图

image.png

一般流程

image.png

  • 特征提取
  • 生成预测
  • 预测结果与标签->计算损失
  • 最小化损失-指导网络学习
  • 重复以上…

一些网络结构

简单图示

  1. vgg网络结构
    image.png
  2. ResNet网络结构
    image.png
  3. DenseNet 网络结构
    image.png

常见处理方式

  • Input 输入层
  • Conv 卷积
  • Activation 激活层
  • Pool 池化层
  • Dropout
  • BN
  • FC 全连接层

框架

Input

训练数据
image.png

Conv

image.png
用参数来提取数据特征。

Activation

image.png

  • Sigmoid
    image.png
  • ReLU
    image.png
    image.png
    给网络加入非线性因素,单纯线性模型的表达力不够。

Pool

image.png
降低参数量。

Dropout

image.png
缓解过拟合。

BN

image.png
批量,归一化。

FC

image.png
分类器。

经过一系列操作后

image.png
image.png
image.png

损失函数

  • Classificition Loss
    一个函数,用来计算预测类别与真实类别的误差。
  • Bounding Box Regeression Loss
    一个函数,用来计算真实框与预测框的误差。

Classificition Loss Function

番外 Softmax

image.png

Cross Entropy Loss

Logistic Loss

Bounding Box Regression Loss Function

SmoothL1 Loss (平滑的)

x为预测框和真实框之间的数值差异,常用的L1和L2 Loss定义为:

  • L1
    image.png
  • L2
    image.png
  • Smooth L1
    image.png
  • Loss :
    image.png

https://arxiv.org/abs/1504.08083

IoU Loss

GIoU Loss

image.png
image.png
image.png
https://arxiv.org/abs/1902.09630

DIoU Loss & CIoU Loss

总结

  • IoU Loss:考虑检测框和目标框重叠面积。

  • GIoU Loss:在IoU的基础上,解决边界框不重合时的问题。

  • DIoU Loss:在IoU的基础上,考虑边界框中心距离的信息。

  • CIoU Loss:在DIoU的基础上,考虑边界框宽高比的尺度信息。

本文链接:https://blog.zxysilent.com/post/object-detection-and-loss.html

-- EOF --