Yolov3算法详解

2023年6月12日上午3:39 • Python • 阅读 77

在本文开题处我们就说过，Yolo系列算法时一种典型的”一阶段”目标检测算法，这是Yolo最为出彩的设计，一次性即可完成对目标的定位和识别——这是RCNN等其他类型的目标检测算法所不能完成的。不过这也要求Yolo模型的输出结果中必须包含目标物体的定位信息和类别信息。

对于模型的输出，Yolov3算法在这一点上的设计堪称绝妙。

主干网络产生了3种不同的特征图，这三中特征图将被分别传入logistic层中，进而运算产生模型的输出。这里多问一句，为什么不使用softmax呢？这是因为softmax对每个框只产生一个分类，在目标检测任务中，存在多个目标物体重合的情况，也就是存在多个分类，softmax就不适用了，所以在Yolo算法中使用了logistic。

有多个输入自然就有多个输出，Yolov3主干网络的3中特征图分别经过logistic层后，也将产生3个输出。在介绍模型输出结果之前，我们有必要先说说Yolov3中应用到的另一种思想——分而治之。

目标检测任务极具挑战性的一个很大原因是因为原始图像中可能包含的目标物体大小不确定。对于这一难题，Yolov3算法的解决思路时将原始图像使用不同的粒度进行划分网格，例如划分为13×13、26×26、52×52的网格。13×13的大网格用于检测大的目标物体，26×26的网格用于检测中等的目标物体，52×52的网格用于检测小目标物体。有没有觉得13、26、52这几个数字很眼熟？没错，这是与主干网络输出的3种特征图的大小是一一对应的。在logistic层的输出结果中，对每个划分单元格都有一个对应的向量来描述目标检测的结果，即在该单元格是否有物体、物体的位置、物体的分类。

在logistic层的输出结果中具体是怎么来描述的检测结果的了？这还得从原始输入图像说起，我们从13×13的网格划分方式为例进行说明。如下图所示，我们将一张图像输入到模型中，13×13的单元格与主干网络的13×13×75的特征图对应，也就是说，13×13×75的特征图经过logistic层后的输出结果将包含$13×13=169$个单元格的检测结果，如图中红色框标识的单元格所示，将包含169个这种向量。每个向量又可以分为3个相同结构的子向量，每个子向量对应一个先验框的检测结果。

先验框是什么鬼，之前没说过呀？别急，现在说也不迟。我们之前所在目标检测任务中一大难点就是目标物体的大小是不确定的，但其实除了大小不确定外，位置也是不确定的，所以我们很难保证在同一个单元格中会不会有多个目标物体覆盖，也即是说，有可能一个单元格需要多个输出，对应可能的多个物体。Yolov3中规定，每个单元格输出3个结果，每个结果对应一个先验框（外文资料中称为Anchor Box，中文翻译各不相同，本文姑且称之为先验框），因为有三种网格划分，所以共有9种先验框。先验框的长宽是在建模前使用k-means对数据集中的标签框进行聚类，得到类别中心点的9个框，作为先验框。在Yolov3作者论文中提出3种尺寸的单元格对应的先验框分别为：

13×13：(10×13), (16×30), (33×23)
26×26：(30×61), (62×45), (59×119)
52×52：(116×90), (156×198), (373×326)

Original: https://www.cnblogs.com/chenhuabin/p/13908615.html
Author: 奥辰
Title: Yolov3算法详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/602823/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

django框架学习操作简述（指令，文件内容，功能）

本文主要记录了django框架几个应用的场景，主要操作均为入门操作，包括django的创建项目启动项目的指令，创建使用APP，视图和URL，数据库ORM，静态文件 pip inst…

Python 2023年8月5日
0041
爱心代码李峋同款爱心 python html

目录前言一、python 1.python 第一个 2.python第二个二、HTML 1.第一个 2.第二个html 3.第三个html 3.第四个html 总结前言最…

Python 2023年8月3日
0061
Build a CRUD App with SQLAlchemy – Using AJAX to send data to flask (附代码)

A synchronous data request is very much like we did with an HTML form submission. Using AJ…

Python 2023年8月12日
0052
AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略导读：ModelScope旨在打造下一代开源的模型即服务共享平台，汇集了行业领先的预…

Python 2023年9月28日
0041
论文解读（GGD）《Rethinking and Scaling Up Graph Contrastive Learning: An Extremely Efficient Approach with Group Discrimination》

论文信息论文标题：Rethinking and Scaling Up Graph Contrastive Learning: An Extremely Efficient App…

Python 2023年10月18日
0052
数据分析 — Pandas②

目录数据筛选给数据打标签行的查改增删 * 查看行 – 索引分片 iloc 修改行 – 情况一情况二新增行删除行数据的分组数据筛选沿用上一…

Python 2023年8月20日
0051
DataFrame基本操作如何取列

import pandas as pd import numpy as np pd.options.display.max_columns = 40 #用列表选取多个列 dataf…

Python 2023年8月18日
0062
python 笔记：tslearn （数据部分）

tslearn 是一个 Python 包，提供用于分析时间序列的机器学习工具。这个包建立在（因此依赖于）scikit-learn、numpy 和 scipy 库之上。使用to_…

Python 2023年8月25日
0045
Python爬虫序章—爬取csdn作者排行榜

上篇文章介绍了requests库获取数据的基本方法，本篇文章利用自动化测试工具selenium进行数据抓取，也会对代码部分进行详细解释，以便小伙伴们能够更加理解和上手。一.sel…

Python 2023年11月5日
0031
2. 科研绘图之 matplotlib 图形窗口

matplotlib 图形窗口图形对象（图形窗口）子图；刻度定位器；刻度网格线；半对数坐标； 1、图形对象（图形窗口） matplotlib 创建窗口的API plt.f…

Python 2023年9月2日
0078
python编程从入门到实践之数据可视化部分总结和回顾(未完待续)

15.1生成数据 matplotlib:是一个数学绘图库，使用它可以制作简单的图标。 pygal包:专注于生成适合在数字设备上显示的图标。通过使用pygal，可以在与图表交互时突出…

Python 2023年8月31日
0050
Numpy基础——数组操作大全（修改、翻转、合并、分割、添加与删除、去重）

函数描述不改变数据的条件下修改形状数组元素迭代器返回一份数组拷贝，对拷贝所做的修改不会影响原始数组返回展开数组 numpy.reshape numpy.reshape 函数…

Python 2023年8月26日
0070
阿里技术官耗时半年总结出“满分”架构笔记，拿捏分布式到微服务

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年9月15日
0040
np.ones用法

numpy.ones(shape, dtype=None, order=’C’, *, like=None)Return a new array of gi…

Python 2023年8月25日
0075
使用supervisor实现后台管理进程

[unix_http_server]file=/tmp/supervisor.sock ; socket文件的路径，supervisorctl用XML_RPC和supervisor…

Python 2023年5月24日
0083
‘scrapy‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。详细解决步骤来了

前言刚学了scrapy，发现第一步就卡住了：’scrapy’ 不是内部或外部命令，也不是可运行的程序或批处理文件。用不了scrapy上网搜索之后完美解决啦…

Python 2023年10月1日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Yolov3算法详解

大家都在看