目标检测
识别图片中有哪些物体以及物体的位置
输入原图

结果图

一般流程

- 特征提取
- 生成预测
- 预测结果与标签->计算损失
- 最小化损失-指导网络学习
- 重复以上…
一些网络结构
简单图示
- vgg网络结构

- ResNet网络结构

- DenseNet 网络结构

常见处理方式
- Input 输入层
- Conv 卷积
- Activation 激活层
- Pool 池化层
- Dropout
- BN
- FC 全连接层
框架
- keras https://keras.io/
- Tensorflow https://tensorflow.google.cn/
- Pytorchhttps://pytorch.org/
Input
训练数据

Conv

用参数来提取数据特征。
Activation

- Sigmoid

- ReLU


给网络加入非线性因素,单纯线性模型的表达力不够。
Pool

降低参数量。
Dropout

缓解过拟合。
BN

批量,归一化。
FC

分类器。
经过一系列操作后



损失函数
- Classificition Loss
一个函数,用来计算预测类别与真实类别的误差。 - Bounding Box Regeression Loss
一个函数,用来计算真实框与预测框的误差。
Classificition Loss Function
番外 Softmax

Cross Entropy Loss
Logistic Loss
Bounding Box Regression Loss Function
SmoothL1 Loss (平滑的)
x为预测框和真实框之间的数值差异,常用的L1和L2 Loss定义为:
- L1

- L2

- Smooth L1

- Loss :

https://arxiv.org/abs/1504.08083
IoU Loss
- IoU

- IoU Loss

- 计算过程

- 一般情况

https://arxiv.org/abs/1608.01471
GIoU Loss



https://arxiv.org/abs/1902.09630
DIoU Loss & CIoU Loss
-
效果

-
一般基于IoU的损失函数

-
DIoU



总结
-
IoU Loss:考虑检测框和目标框重叠面积。
-
GIoU Loss:在IoU的基础上,解决边界框不重合时的问题。
-
DIoU Loss:在IoU的基础上,考虑边界框中心距离的信息。
-
CIoU Loss:在DIoU的基础上,考虑边界框宽高比的尺度信息。























