目标检测学习笔记

2023年7月12日下午1:13 • 人工智能 • 阅读 77

目标检测学习笔记1.0（李沐）

; 目标检测学习笔记2.0（赵卫东）

整张图作为输入
这儿的C是指整个数据集总共只有C类，但是我们只是对每个网格进行类别的预测，不单独对每一个边框进行类别的预测。

目标检测学习笔记3.0（霹雳吧啦Wz）

; 目标检测学习笔记4.0（人工智能-迪迦）

一、 YOLOV1

recall：你标记的物体是不是都检测到了多少

精度和召回率的计算公式：

置信度，被检测到的东西是一个物体的概率，下图是在进行人脸检测，所以此时的置信度就是检测到的东西是人脸的概率是多少。
而置信度阈值是程序员自己设置的，当你把阈值设置为0.8，那么置信度低于0.8的框都不会出现。就是是当机器检测出的物体的置信度低于0.8，我们程序员就认为被检测到的东西不是一个物体，拿下图举例，当下图中的置信度低于0.8，那么我们程序员就认为被检测到的区域不是一个人脸，就不再显示。只有大于阈值的框才会被显示出来。

下图中，斜线的阴影面积的大小就被称作MAP值。

10.

我们对于狗有两个黄色的候选框，但是这两个黄色的候选框我们应该选哪个呢？
蓝色的是我们标记的框，通过计算IOU的值，我们知道长方形的候选框的IOU值更大，所以选择长方形的候选框，然后呢，毕竟我们长方形的候选框和蓝色的真实标记的候选框之间还是存在一定的差距，所以，我们还需要对黄色的框进行微调，那怎样微调呢？因为模型是不知道真实的蓝色框的形状的，所以这里需要既往长调，也要往宽调（这儿还要考虑一个置信度，对于置信度低的框，直接舍去了）。是不是可以通过增加长方形黄色框的长和宽，增加完之后，我们再去计算新的候选款和蓝色的框之间的IOU，就能知道下一步该选择哪一个候选框，以此类推。

其实还要对每一个框做一个confidence，对于那些confidence值比较小的框就直接舍去不要。

11.

对于yolov1它的输入图片的大小是固定的，在使用是不能随意改变，

12…

15.

16.

17.

当wi比较小时，它比较敏感（斜率比较大），当wi比较大时，斜率比较小（不是很敏感）

下图框起来的是权重项，作用应该是衡量w，h 与x，y对于结果影响的程度的大小。

在一张图片中，有些是前景，有些背景，所以在讨论置信度误差时，要分开讨论，分为含有object的和不含object的。我们可以设置，前景的真实置信度为1，背景的真实置信度为0。
当某一个框和真实框之间的置信度是0.7（如下图中的黑色框，红色框是正式的目标框），但是框有很多，现在又有一个绿色的框，它和红色的框的置信度是0.6.我们设置置信度阈值是0.5.那么在这里由于有两个框都和真实框有重叠部分，我们在计算置信度误差时就只算置信度最高的0.7的黑色框，把绿色框舍去。

当置信度低于0.5的，我们在程序逻辑设计就已经认为这里不存在物体，所以置信度直接就设置为0。

20.

之所以在下图红色框中加速权重，使用为在实际使用中，图片一般背景多，儿前景少，如果不加权重参数，那么损失函数很大程度被背景影响，那么这个损失函数最终实现的目的就是迫使网络模型去寻找背景，但是我们设计这个网络模型的目的是找物体，所以损失函数应该受前景的影响更大，所以这里需要设置一个权重参数。

21.

网络架构：

损失函数：

22.

yolo测试的时候，当你设置一个置信度阈值之后，大于置信度阈值的候选框可能会有很多个，但是由于它们检测到的都是同一个物体，所以我们对同一个物体的所有候选款置信度之间排序，选择置信度最大的候选框显示即可。

23.

; 二、yolov2

yolov2中没有全连接层了

每次卷积之后都加了batch normalization

上图的13 _13，就是下面最后的把yolov1的7_7换成13*13，这样相同的一张图片yolov2得到的方框会更多，检测到的物体也会更多，也更加容易检测到小物体。

10.

11.

通过下面的实验就得出yolov2中一个框，会有5个候选款比较合适，并且通过聚类，聚类的k=5，所以每一个框有5个候选框，且每一个候选框的大小就是聚类的中心x，y。

12.

recall：；对于一张图中标记的物体，recall越高，表示模型能够检测到的物体越多。

下面这张图是在讲解yolov1的缺点。需要改进的地方。

15.

16.

方框中的数值，是通过之前进行k聚类得到的宽和高的数值大小。

17.

18.

19.

在yolov1中模型预测的直接的移动位置，而在yolov2中预测的是相对位置，且这个相对位置逃不出一个13*13中的小方框，也就是下面的红色方框中的值会在一个小方框中，不会出这个小方框

20.

21.

22.

23.

由于之间的感受野太大，导致一些小目标会被忽略，所以进行了改进，下面这个在上面的卷积后会得到大目标，而下面的残差结构会结合小目标，这样就即考虑了大目标也考虑了小目标。

24.

由于实际应用中，输入图片的大小难以统一，并且统一的图片，可能对于结果的影响很大，所以对于yolov2就设置成输入的图片大小可以是不同的。

三、YOLOV3

左边的图像金字塔，它需要把原始图片先resize成三种不同的尺寸，但是resize三种不同的尺寸，相当于要做三次，那么这样会让我们的模型的速度变得很慢，而在yolov中速度是第一位的，所以这是不被允许的。

YOLOV3网络模型取名叫做darknet-53

10.

11.

13.

14.

由于是多标签，这里最后使用的是二分类方法去实现。

15.

Original: https://blog.csdn.net/qq_34848334/article/details/123254617
Author: QT-Smile
Title: 目标检测学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687716/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

三个参数对随机森林分类结果的影响（附代码）

使用手写数据集研究集成规模，树的最大深度以及特征数对随机森林分类结果的影响。代码在末尾。使用交叉验证，返回accuracy，折数为10 ; 1. 集成规模n_estimator…

人工智能 2023年7月3日
0073
PyQt+Opencv-python多线程显示摄像头信息至QLabel，摄像头显示区域自由拉伸尺寸

文章目录前言效果资源下载核心代码 * 编程思路 Camera.py Widget.py 资源下载前言通过PyQt与Opencv-python实现多线程显示摄像头信息至Q…

人工智能 2023年7月19日
0099
数据分析之Pandas(基本操作)

目录 1. pandas简介 2. 导入pandas 3. Series的创建及属性 3.1 列表形式创建 3.2 字典形式创建 3.3 创建日期（periods为天数） 3.4 …

人工智能 2023年7月8日
0073
attention+pytorch+时间序列数据预测

将用于NLP的Encoder-Decoder修改用于时间序列数据预测，实验发现添加注意力机制后预测效果能够得到提升。 class Encoder (nn.Module): def …

人工智能 2023年7月21日
0060
基于Java+Spring+Vue+elementUI大学生求职招聘系统详细设计实现

博主介绍： ✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技…

人工智能 2023年7月29日
0045
【论文阅读】注意力综述（软注意力）

以下内容来自：综述：图像处理中的注意力机制 – 知乎目录概述软注意力 Spatial Transformer Networks(空间域注意力)—2015 nips…

人工智能 2023年7月12日
0055
ROS中级：Marker 向rviz发送基本形状 (C++)

目录一、说明二、介绍三、创建一个包四、发送Marker代码 4.1 编码 4.2、编辑CMake脚本五、程序分析六、构建代码七、运行代码八、查看标记九、错误和改…

人工智能 2023年6月10日
0057
通道注意力与空间注意力模块

通道注意力模块使用通道注意力模块的目的：为了让输入的图像更有意义，大概理解就是，通过网络计算出输入图像各个通道的重要性（权重），也就是哪些通道包含关键信息就多加关注，少关注没什…

人工智能 2023年6月16日
0088
第十四届蓝桥杯模拟赛第一期试题【Java解析】

目录 A 二进制位数问题描述答案提交参考答案解析 B 晨跑问题描述答案提交参考答案解析 C 调和级数问题描述答案提交参考答案解析 D 山谷问题描述答案提…

人工智能 2023年7月29日
0048
ARIMA差分自回归移动平均模型–时间序列预测

ARIMA差分自回归移动平均模型 1、ARIMA模型理论基础 2、ARIMA建模步骤 3、ARIMA建模实战 * 3.1 导入模块 3.2 加载数据 3.3 平稳性检验 3.4 单…

人工智能 2023年6月16日
0083
强化学习 DQN 经验回放是什么

经验重放：强化学习由于state之间的相关性存在稳定性的问题，因为智能体去探索环境时采集到的样本是一个时间序列，样本之间具有连续性，所以需要打破时间相关性，解决的办法是在训练的时…

人工智能 2023年7月28日
0071
【Python 实战基础】Pandas中Series与数据list如何互相转换

一、实战场景二、主要知识点文件读写基础语法 Pandas Pandas的Series对象互相转换三、菜鸟实战 1、创建 python 文件，数据list，变成Pandas…

人工智能 2023年7月8日
0032
Openpose Windows10环境并且是3系显卡+ Unity 环境部署

Openpose Windows10环境并且是3系显卡 + Unity 环境部署此文章适用于 3系显卡高版本的驱动地址：openpose官方安装版本https://github…

人工智能 2023年7月20日
0044
声控红外实验

一、实验简介个人学习制作的一个小实验，功能为用一块板子的语音和红外功能去控制另一块板子的LED灯亮灭以及蜂鸣器响应。二、所用模块 1.STM32F4系列板子2个 2.LD332…

人工智能 2023年5月25日
0094
NLP-实体消歧/实体统一

目录一、实体消歧二、实体统一 1.编辑距离 2.基于规则 3.监督学习方法 4.基于图的实体统一一、实体消歧当个实体有多个解释的时候，可以通过计算相似度的方式，消除歧义。 …

人工智能 2023年5月30日
10121
免费GPU：九天•毕昇平台使用教程

背景深度学习非常依赖设备，训练模型就类似在”炼丹”，没有好的炼丹炉，想要复现顶刊中那些动辄8卡/4卡 Tesla V100显卡训练的模型，只能是&#822…

人工智能 2023年6月23日
00106

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30