目标检测
识别图片中有哪些物体以及物体的位置
输入原图
结果图
一般流程
- 特征提取
- 生成预测
- 预测结果与标签->计算损失
- 最小化损失-指导网络学习
- 重复以上…
一些网络结构
简单图示
- vgg网络结构
- ResNet网络结构
- DenseNet 网络结构
常见处理方式
- Input 输入层
- Conv 卷积
- Activation 激活层
- Pool 池化层
- Dropout
- BN
- FC 全连接层
框架
- keras https://keras.io/
- Tensorflow https://tensorflow.google.cn/
- Pytorchhttps://pytorch.org/
Input
训练数据
Conv
用参数来提取数据特征。
Activation
- Sigmoid
- ReLU
给网络加入非线性因素,单纯线性模型的表达力不够。
Pool
降低参数量。
Dropout
缓解过拟合。
BN
批量,归一化。
FC
分类器。
经过一系列操作后
损失函数
- Classificition Loss
一个函数,用来计算预测类别与真实类别的误差。 - Bounding Box Regeression Loss
一个函数,用来计算真实框与预测框的误差。
Classificition Loss Function
番外 Softmax
Cross Entropy Loss
Logistic Loss
Bounding Box Regression Loss Function
SmoothL1 Loss (平滑的)
x为预测框和真实框之间的数值差异,常用的L1和L2 Loss定义为:
- L1
- L2
- Smooth L1
- Loss :
https://arxiv.org/abs/1504.08083
IoU Loss
- IoU
- IoU Loss
- 计算过程
- 一般情况
https://arxiv.org/abs/1608.01471
GIoU Loss
https://arxiv.org/abs/1902.09630
DIoU Loss & CIoU Loss
-
效果
-
一般基于IoU的损失函数
-
DIoU
总结
-
IoU Loss:考虑检测框和目标框重叠面积。
-
GIoU Loss:在IoU的基础上,解决边界框不重合时的问题。
-
DIoU Loss:在IoU的基础上,考虑边界框中心距离的信息。
-
CIoU Loss:在DIoU的基础上,考虑边界框宽高比的尺度信息。