YOLO目标检测

2023年7月11日下午9:32 • 人工智能 • 阅读 62

发展历程：

YOLOV1 (CVPR2016)->YOLOV2/YOLO9000 (CVPR2017)->YOLOV3 (2018)->YOLOV4 (2020)

->YOLOV5 (2020)->YOLOV6 (2021)->YOLOV7 (2022)

目标检测分为两类：一阶段和二阶段

一阶段也可叫做端到端，输入图片后直接输出检测框和种类（YOLO系列）；

二阶段先画出检测框，再进行分类（Fast-RCNN、Mask-RCNN、Faster-RCNN）。

对于VOC2012数据集，首先生成7×7个grid cell，每一个grid cell生成两个bounding box并赋予对应的置信度，

最后保留置信度最高的bounding box

共有20个类，每一个grid cell生成对应20个类的概率，选取最大概率并保留

Bounding Boxes：

将输入图像分成n块，这里是9个grid cell，利用图像分类和定位算法，逐一应用到每个格子中，每个格子指定一个标签y

y中各元素的含义：Pc：是否有物体；bx、by、bh、bw：如果有对象，输出格子的边界框；c1、c2、c3：对象的类别。

因为上面三个格子啥玩意没有，Pc=0，其他的不管

如果中间一个格子两边格子中车的部分区域，那么会对对象分配中心点，中心点落在哪里就属于哪个格子，而另一个格子中的区域将不会被识别

对于右边和左边格子：

最终的目标输出尺寸为3x3x8，每一个格子左上角为（0,0）右下角为（1,1），bx、by为中心点，bh、bw为高和宽，以上数值只能在[0,1]。

交并比

预测与标签的交集和并集之比

目标定位：

检测出对象位置，用检测框标出，判断对象在图片中的具体位置

非极大值抑制（NMS）

NMS可以保证对每个对象只检测一次，计算不同矩形框的交并比，并抑制概率小的矩形框，只能输出概率最大的预测结果。

Anchor box：

预先定义两个框

当图像中检测到有两个不同类别的对象重叠在一起时，只能选择一个输出，加入anchor box 后，会进行相应的匹配，同时输出两个。

YOLO算法

3×3表示9个网格、2代表两个anchor box、8代表向量中的类

1.找到每个格子中的两个预测的边界框，bounding box可以超过格子的高度和宽度

2.去掉概率低的bounding boxs

3.对每个类别单独的运行非最大值抑制

Original: https://blog.csdn.net/qq_60609496/article/details/126794644
Author: 视觉菜鸟Leonardo
Title: YOLO目标检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/686328/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NeRF神经辐射场学习笔记（十）— BungeeNeRF（CityNeRF）实现以及代码注释

NeRF神经辐射场学习笔记（十）— BungeeNeRF（CityNeRF）实现以及代码注释声明准备工作运行测试代码解读 * train()主体框架： BungeeNeRF…

人工智能 2023年6月17日
00122
ORB特征提取和匹配

* – 一、步骤 – 二、代码 – 三、部分结果展示 – + * – 3.1 使用Sobel算子且方向为vertical…

人工智能 2023年6月20日
00105
华为三位大佬耗时半年终成MySQL金字塔，面试无忧！

MySQL概述 MySQL是一个开源的关系型数据库管理系统，由瑞典MySQL AB公司1995年开发，迅速成为最流行的开源关系型数据库管理系统。在 WEB 应用方面 MySQL …

人工智能 2023年6月30日
0087
YOLOv5训练自己的数据集（超详细完整版）

一.Requirements 本教程所用环境：代码版本V3.0，源码下载地址：https://github.com/ultralytics/yolov5.gitPytorch：1….

人工智能 2023年5月26日
0059
yolov7使用onnx推理（带&不带NMS）

官方代码： GitHub – WongKinYiu/yolov7: Implementation of paper – YOLOv7: Trainable …

人工智能 2023年7月27日
0077
车道线检测数据集介绍

1.Tusimple数据集特点：位于高速路，天气晴朗，车道线清晰，特点是车道线以点来标注。(ground_truth:json格式) （提供带有实例级车道注释的大规模图像数据。 …

人工智能 2023年7月27日
0078
Learning算法中的强化学习是指什么

强化学习简介强化学习是机器学习中的一个分支，旨在使智能体通过与环境的交互来学习最优行为策略。在强化学习中，智能体不需要事先获得标记过的数据，而是通过尝试和错误的方式来逐步改善其策…

人工智能 2024年1月1日
0030
在神经网络中，不同类型的Layer）有哪些

问题：在神经网络中，不同类型的Layer有哪些？在神经网络中，不同类型的Layer用于对输入数据进行不同的变换和处理。本文将介绍神经网络中常见的几种Layer类型，包括全连接层（…

人工智能 2024年1月3日
0049
一种基于 OpenPose 的跌倒检测系统

1. 项目背景简介人们在行走和奔跑等情况下，经常会发生摔倒的情况。对于正常人而言，在摔倒不是特别严重的情况下，人们可以立刻起来或者打电话报警或者通知家人，然而对于一些特殊的人群…

人工智能 2023年7月29日
00123
ORB_SLAM2及其他SLAM精度测评

ORB_SLAM2及其他SLAM精度测评测试工具：https://svncvpr.in.tum.de/cvpr-ros-pkg/trunk/rgbd_benchmark/rgbd…

人工智能 2023年6月10日
0086
分水岭算法的python实现及解析

1 算法简介分水岭算法的原理很容易查到，但是很多文章都是直接用的opencv或matlab函数，看不到具体实现方法，这篇文章希望能对大家有点帮助。分水岭算法就是往山谷中注水，把…

人工智能 2023年6月17日
0088
【Python】DataFrame学习01_创建、索引、访问、编辑、读写、统计描述

本人依据上课学习内容，将dataframe内容浓缩为代码块，一下是今天学习的第一部分:1.dataframe创建2.dataframe索引3.dataframe数据访问（重要）4….

人工智能 2023年7月7日
0071
c++函数模板与类模板

1 模板介绍模板是C++中泛型编程的基础。一个模板就是一个创建类或函数的蓝图或者公式。 2 函数模板 2.1 函数模板的实现函数模板形式 template 类型函数名(形参表…

人工智能 2023年6月29日
0065
深度强化学习-Double DQN算法原理与代码

深度强化学习-Double DQN算法原理与代码引言 1 DDQN算法简介 2 DDQN算法原理 3 DDQN算法伪代码 4 仿真验证引言 Double Deep Q Netw…

人工智能 2023年7月28日
0078
CA：用于移动端的高效坐标注意力机制 | CVPR 2021

论文提出新颖的轻量级通道注意力机制coordinate attention，能够同时考虑通道间关系以及长距离的位置信息。通过实验发现，coordinate attention可有效…

人工智能 2023年6月15日
0083
拟合sin函数和实现12个手写汉字分类

193020xxxxx 觉觉文章目录请添加图片描述 * 代码基本架构 – Neuron类 Layer类 Network类用于拟合sin的函数用于实现汉字分类的函…

人工智能 2023年7月3日
0049

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLO目标检测

Bounding Boxes：

交并比

目标定位：

非极大值抑制（NMS）

YOLO算法

大家都在看