YOLO学习笔记5——YOLOV3详解

一、网络解析

输入:416x416x3
输出:3个feature map:13x13x255、26x26x255、52x52x255(255 = 3×85 =3 x(4+1+80) )

YOLO学习笔记5——YOLOV3详解
分别下采样32倍、16倍、8倍得到输出13x13x255、26x26x255、52x52x255,在MCCOCO目标检测竞赛中,小物体

1、分别抽取到下采样32倍、16倍、8倍的特征
2、下采样32倍的特征变成13x13x255 ——> 经过一次上采样2倍变成26×26 ——> 和26×26尺度的特征进行拼接(Concat,沿厚度方向堆落)——> 26×26的数据结构再经过上采样变成52×52 ——> 和52×52尺度的特征进行拼接
3、该结构可以实现多尺度特征融合和不同尺寸物体的预测,既能发挥深层网络的特化抽象的语义信息,又能发挥浅层网络像素结构的底层的细粒度的信息
+ 深度学习浅层学习:边缘、形状、转角、斑块、颜色等底层细粒度的信息
+ 深度学习深层学习:纹理、眼睛、腿等抽象特化的语义信息
4、CBL = Conv + BN + Leaky relu(每个卷积层之后包含一个批量归一化层和一个Leaky ReLU,目的是为了防止过拟合)
5、Res unit :残差模块

; 二、YOLOV3 骨干网络

darknet-53去除了全局平均池化层和全连接层,是一个全卷积网络

YOLO学习笔记5——YOLOV3详解
anchor数:
yolov1:7x7x2 = 98
yolov2:13x13x5 = 845
yolov3:3x(13×13+26×26+52×52) = 10647

三、训练

YOLO学习笔记5——YOLOV3详解
对于负责拟合物体的grid cell:
对标注框中心点所在的grid cell产生的3个anchor(三个尺寸 13×13、26×26、52×52),由与物体实际标注iou重合度最高的那个anchor所在的grid cel来拟合物体

每个grid cell生成3个anchor,每个anchor对应一个预测框,每一个预测框5+80(x,y,w,h,objectness score,coco数据集80个类)
+ objectness score : 预测框包含目标的概率
+ class scores : 在预测框已经包含目标的概率下80个类别的条件概率

YOLO学习笔记5——YOLOV3详解

正负样本:

YOLO学习笔记5——YOLOV3详解
对于人工设置的阈值(yolov3为0.5)
正样本:与ground_truth 的IOU(大于设定的阈值)最大的anchor
忽略:与ground_truth的IOU大于设定的阈值,但不是最大的那个,忽略
负样本:与ground_truth的IOU小于设定的阈值

损失函数:

YOLO学习笔记5——YOLOV3详解

; 四、训练过程

YOLO学习笔记5——YOLOV3详解

五、测试过程

YOLO学习笔记5——YOLOV3详解
学习视频连接:https://www.bilibili.com/video/BV1Vg411V7bJ?spm_id_from=333.337.search-card.all.click&vd_source=f3e3bb108629bcdd87dc36e9ca94aac2

Original: https://blog.csdn.net/baidu_41906969/article/details/124735951
Author: 卖strawberry的小女孩
Title: YOLO学习笔记5——YOLOV3详解

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/681127/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球