2020-06-30 10:04:14

目标检测与损失函数

目标检测

识别图片中有哪些物体以及物体的位置

输入原图

结果图

一般流程

特征提取
生成预测
预测结果与标签->计算损失
最小化损失-指导网络学习
重复以上…

一些网络结构

简单图示

vgg网络结构
ResNet网络结构
DenseNet 网络结构

常见处理方式

Input 输入层
Conv 卷积
Activation 激活层
Pool 池化层
Dropout
BN
FC 全连接层

框架

keras https://keras.io/
Tensorflow https://tensorflow.google.cn/
Pytorchhttps://pytorch.org/

Input

训练数据

Conv

用参数来提取数据特征。

Activation

Sigmoid
ReLU

给网络加入非线性因素，单纯线性模型的表达力不够。

Pool

降低参数量。

Dropout

缓解过拟合。

BN

批量，归一化。

FC

分类器。

经过一系列操作后

损失函数

Classificition Loss
一个函数，用来计算预测类别与真实类别的误差。
Bounding Box Regeression Loss
一个函数，用来计算真实框与预测框的误差。

Classificition Loss Function

番外 Softmax

Cross Entropy Loss

Logistic Loss

Bounding Box Regression Loss Function

SmoothL1 Loss (平滑的)

x为预测框和真实框之间的数值差异，常用的L1和L2 Loss定义为：

L1
L2
Smooth L1
Loss ：

https://arxiv.org/abs/1504.08083

IoU Loss

IoU
IoU Loss
计算过程
一般情况

https://arxiv.org/abs/1608.01471

GIoU Loss

https://arxiv.org/abs/1902.09630

DIoU Loss & CIoU Loss

效果
一般基于IoU的损失函数
DIoU
CIoU

https://arxiv.org/abs/1911.08287

总结

IoU Loss：考虑检测框和目标框重叠面积。
GIoU Loss：在IoU的基础上，解决边界框不重合时的问题。
DIoU Loss：在IoU的基础上，考虑边界框中心距离的信息。
CIoU Loss：在DIoU的基础上，考虑边界框宽高比的尺度信息。

本文链接：https://blog.zxysilent.com/post/object-detection-and-loss.html

-- EOF --

zxysilent发表于 2020-06-30 10:04:14，最后修改于 2020-07-04 13:48:25