YOLO学习笔记5——YOLOV3详解

2023年7月9日下午5:29 • 人工智能 • 阅读 70

一、网络解析

输入：416x416x3
输出：3个feature map：13x13x255、26x26x255、52x52x255（255 = 3×85 =3 x(4+1+80) ）

分别下采样32倍、16倍、8倍得到输出13x13x255、26x26x255、52x52x255，在MCCOCO目标检测竞赛中，小物体

1、分别抽取到下采样32倍、16倍、8倍的特征
2、下采样32倍的特征变成13x13x255 ——> 经过一次上采样2倍变成26×26 ——> 和26×26尺度的特征进行拼接(Concat，沿厚度方向堆落）——> 26×26的数据结构再经过上采样变成52×52 ——> 和52×52尺度的特征进行拼接
3、该结构可以实现多尺度特征融合和不同尺寸物体的预测，既能发挥深层网络的特化抽象的语义信息，又能发挥浅层网络像素结构的底层的细粒度的信息
+ 深度学习浅层学习：边缘、形状、转角、斑块、颜色等底层细粒度的信息
+ 深度学习深层学习：纹理、眼睛、腿等抽象特化的语义信息
4、CBL = Conv + BN + Leaky relu（每个卷积层之后包含一个批量归一化层和一个Leaky ReLU，目的是为了防止过拟合）
5、Res unit ：残差模块

; 二、YOLOV3 骨干网络

darknet-53去除了全局平均池化层和全连接层，是一个全卷积网络

anchor数：
yolov1：7x7x2 = 98
yolov2：13x13x5 = 845
yolov3：3x(13×13+26×26+52×52) = 10647

三、训练

对于负责拟合物体的grid cell：
对标注框中心点所在的grid cell产生的3个anchor（三个尺寸 13×13、26×26、52×52），由与物体实际标注iou重合度最高的那个anchor所在的grid cel来拟合物体

每个grid cell生成3个anchor，每个anchor对应一个预测框，每一个预测框5+80(x,y,w,h,objectness score,coco数据集80个类)
+ objectness score : 预测框包含目标的概率
+ class scores : 在预测框已经包含目标的概率下80个类别的条件概率

正负样本：

对于人工设置的阈值（yolov3为0.5）
正样本：与ground_truth 的IOU（大于设定的阈值）最大的anchor
忽略：与ground_truth的IOU大于设定的阈值，但不是最大的那个，忽略
负样本：与ground_truth的IOU小于设定的阈值

损失函数：

; 四、训练过程

五、测试过程

学习视频连接：https://www.bilibili.com/video/BV1Vg411V7bJ?spm_id_from=333.337.search-card.all.click&vd_source=f3e3bb108629bcdd87dc36e9ca94aac2

Original: https://blog.csdn.net/baidu_41906969/article/details/124735951
Author: 卖strawberry的小女孩
Title: YOLO学习笔记5——YOLOV3详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/681127/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

citespace如何导出图片_如何用CiteSpace和AlluvialGenerator做Alluvial Flow

如何用CiteSpace和AlluvialGenerator做Alluvial Flow CiteSpace常见问题系列数据分析过程本例的数据是Web of Science上引…

人工智能 2023年6月1日
00257
【语音识别】Kaldi相关工具包及示例数据介绍

语言:Bahasa Indonesia,Bahasa Melayu,Deutsch,English,Filipino,Français,Kiswahili,Nederlands,N…

人工智能 2023年5月25日
0070
基于Python实现相机标定正畸并生成鸟瞰图

资源下载地址：https://download.csdn.net/download/sheziqiong/85836848资源下载地址：https://download.csdn….

人工智能 2023年5月26日
0084
关于安装pytorch的简单步骤及一些问题解决

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月27日
0051
Jenkins详细安装配置部署–超详细

Jenkins详细安装配置部署–超详细一、什么是CI/CD 二、Gitlab内置持续集成 * 持续集成（CI）持续交付（CD） 2.1 Gitlab的CI/CD优势…

人工智能 2023年6月26日
0068
c++ 函数重载

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月29日
0080
C++基础-4-封装（构造函数与析构函数，深拷贝与浅拷贝，静态成员，this，友元，const修饰成员函数）

封装 4.1.1 封装的意义 4.1.2 成员属性私有化 4.2.1 构造函数与析构函数 4.2.2 构造函数的分类与调用 4.2.3 拷贝构造函数的调用时机 4.2.4 构造函数…

人工智能 2023年6月4日
0077
1 通俗易懂解释Resnet50

通俗易懂Resnet50网络结构分析 1 Why(该网络要解决什么样的问题) * 1.1 什么叫梯度消失和梯度爆炸 2 How(如何解决该问题) * 2.1 直观解释 2.2 残差…

人工智能 2023年7月13日
0073
Opencv中Mat类详细解读（学习笔记）

基于windows10、vs2015、OpenCv4.1.0。目录 1、Mat类简介 2、Mat类的构造与赋值 2.1、Mat类的构造 2.2、Mat类的赋值 3、Mat类支持的…

人工智能 2023年7月19日
0091
最小二乘支持向量机–LSSVM分类及MATLAB代码实现

最小二乘支持向量机–LSSVM分类及MATLAB代码实现文章目录最小二乘支持向量机–LSSVM分类及MATLAB代码实现 1. LSSVM算法原理 * 1.1 支持…

人工智能 2023年7月2日
0096
深度学习之图像分类（十一）–MobileNetV2 网络结构

深度学习之图像分类（十一）MobileNetV2 网络结构目录 * – 深度学习之图像分类（十一）MobileNetV2 网络结构 – + 1. 前言 +…

人工智能 2023年7月21日
0051
优化算法SGD与Adam

说来惭愧，一直在用的两个经典的优化器，几行代码就完成了参数更新，但是却一直没有深入的了解其中的原理。 improt torch … optimizer = torch.opti…

人工智能 2023年6月15日
0074
tensor中数据类型的相互转换

Pytorch中的Tensor常用的类型转换函数 tensor数据类型转换例如： a = tensor(282, device=’cuda:0′) b =…

人工智能 2023年6月16日
00100
【无标题】

之前看见稚晖君在动态里转发了昇腾训练营的宣传动态，翻了一下评论区，听说菜鸟也能参加，于是我就去了，一趟流程走下来，感觉还不错，蛮推荐小白去的。然后我在写大作业的时候也罢过程记录了下…

人工智能 2023年5月25日
0078
改进YOLOv5系列：9.BoTNet Transformer结构的修改

💡统一使用 YOLOv5 代码框架，结合不同模块来构建不同的YOLO目标检测模型。 🌟本项目包含大量的改进方式,降低改进难度,改进点包含 【Backbone…

人工智能 2023年7月25日
0071
目标检测小结(RCNN、fast RCNN、faster RCNN)

RCNN又称基于候选框的目标检测算法主要由三步组成，生成候选区域，传入神经网络，分类生成候选区域：采用像素、色域分割图像，可以采用生成树算法，SS选着性搜索算法传入神经网络：…

人工智能 2023年7月10日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31