二、目标检测算法之R-CNN

2023年10月25日上午6:55 • Python • 阅读 40

二、目标检测算法之R-CNN

1、R—CNN发展过程和各自的优缺点

1.1 R-CNN

（1）R-CNN原理

通过滑动窗口来检测不同的目标类型（从左到右、从上到下滑动窗口，利用分类识别目标），我们使用不同大小和宽高比的窗口。
这样就变成每张子图片输出类别以及位置，变成分类问题。但是滑动窗口需要初始设定一个固定大小的窗口，这就遇到了一个问题，有些物体适应的框不一样，所以需要提前设定K个窗口（为了物体适应框不一样，所以这k个窗口大小是不一样的），每个窗口滑动提取M个，总共K x M 个图片，通常会直接将图像变形 转换成固定大小的图像，变形图像块被输入 CNN 分类器中，
提取特征后，我们使用一些分类器识别类别和该边界框的另一个线性回归器。
简而言之，当一张图片中存在多个目标时，我们需要想办法将其转变成多张固定大小的子图片，然后通过CNN提取特征，再进行类别分类(识别)和边框回归(后面会说)。这样，一个多目标的检测问题，就转变成了机器学习常见的多分类问题。

（2）R-CNN缺点

1、训练阶段多：步骤繁琐: 微调网络+训练SVM+训练边框回归器。
2、训练耗时：占用磁盘空间大：5000张图像产生几百G的特征文件。（VOC数据集的检测结果，因为SVM的存在）
3、处理速度慢: 使用GPU, VGG16模型处理一张图像需要47s。
4、图片形状变化：候选区域要经过crop/warp进行固定大小，无法保证图片不变形

1.2 Fast R-CNN

（1）Fast R-CNN原理

使用特征提取器（CNN）先提取整个图像的特征,然后将创建候选区域的方法直接应用到提取到的特征图上，这些关注区域随后会结合对应的特征图以裁剪为特征图块，并用于目标检测任务中。我们使用 ROI 池化将特征图块转换为固定的大小，并馈送到全连接层进行分类和定位。

（2）Fast R-CNN优缺点

优点：
因为 Fast-RCNN 不会重复提取特征，因此它能显著地减少处理时间。
Fast R-CNN 最重要的一点就是包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练，这种多任务损失即结合了分类损失和定位损失的方法，大大提升了模型准确度
缺点：
Fast R-CNN 依赖于外部候选区域方法，如选择性搜索。但这些算法在 CPU 上运行且速度很慢。在测试中，Fast R-CNN 需要 2.3 秒来进行预测，其中 2 秒用于生成 2000 个 ROI。

1.2 Faster R-CNN

（1）Faster R-CNN原理

Faster R-CNN在Fast R-CNN的基础上用内部深层网络代替了候选区域方法。

（2）Faster R-CNN优缺点

优点：新的候选区域网络（RPN）在生成 ROI 时效率更高，并且以每幅图像 10 毫秒的速度运行。
拓展：
ROI 池化：
因为 Fast R-CNN 使用全连接层，全连接层同一批图像的输入必须是同一大小的，所以我们应用 ROI 池化将不同大小的 ROI 转换为固定大小。
（他会先对特征图分成好几个小块，然后对每个小块取最大值的出一个新的维度的特征值。）

2、R-CNN算法原理

2.1R-CNN步骤

步骤（以AlexNet网络为基准）

1.&#x627E;&#x51FA;&#x56FE;&#x7247;&#x4E2D;&#x53EF;&#x80FD;&#x5B58;&#x5728;&#x76EE;&#x6807;&#x7684;&#x4FAF;&#x9009;&#x533A;&#x57DF;region proposal
2.&#x8FDB;&#x884C;&#x56FE;&#x7247;&#x5927;&#x5C0F;&#x8C03;&#x6574;&#x4E3A;&#x4E86;&#x9002;&#x5E94;AlexNet&#x7F51;&#x7EDC;&#x7684;&#x8F93;&#x5165;&#x56FE;&#x50CF;&#x7684;&#x5927;&#x5C0F;227&#xD7;227&#xFF0C;&#x901A;&#x8FC7;CNN&#x5BF9;&#x5019;&#x9009;&#x533A;&#x57DF;&#x63D0;&#x53D6;&#x7279;&#x5F81;&#x5411;&#x91CF;&#xFF0C;2000&#x4E2A;&#x5EFA;&#x8BAE;&#x6846;&#x7684;CNN&#x7279;&#x5F81;&#x7EC4;&#x5408;&#x6210;2000&#xD7;4096&#x7EF4;&#x77E9;&#x9635;
3.&#x5C06;2000&#xD7;4096&#x7EF4;&#x7279;&#x5F81;&#x4E0E;20&#x4E2A;SVM&#x7EC4;&#x6210;&#x7684;&#x6743;&#x503C;&#x77E9;&#x9635;4096&#xD7;20&#x76F8;&#x4E58;(20&#x79CD;&#x5206;&#x7C7B;&#xFF0C;SVM&#x662F;&#x4E8C;&#x5206;&#x7C7B;&#x5668;&#xFF0C;&#x5219;&#x6709;20&#x4E2A;SVM)&#xFF0C;&#x83B7;&#x5F97;2000&#xD7;20&#x7EF4;&#x77E9;&#x9635;
4.&#x5206;&#x522B;&#x5BF9;2000&#xD7;20&#x7EF4;&#x77E9;&#x9635;&#x4E2D;&#x6BCF;&#x4E00;&#x5217;&#x5373;&#x6BCF;&#x4E00;&#x7C7B;&#x8FDB;&#x884C;&#x975E;&#x6781;&#x5927;&#x503C;&#x6291;&#x5236;&#xFF08;NMS:non-maximum suppression&#xFF09;&#x5254;&#x9664;&#x91CD;&#x53E0;&#x5EFA;&#x8BAE;&#x6846;&#xFF0C;&#x5F97;&#x5230;&#x8BE5;&#x5217;&#x5373;&#x8BE5;&#x7C7B;&#x4E2D;&#x5F97;&#x5206;&#x6700;&#x9AD8;&#x7684;&#x4E00;&#x4E9B;&#x5EFA;&#x8BAE;&#x6846;
5.&#x4FEE;&#x6B63;bbox&#xFF0C;&#x5BF9;bbox&#x505A;&#x56DE;&#x5F52;&#x5FAE;&#x8C03;

2.2 候选区域

选择性搜索（SelectiveSearch，SS）中，首先将每个像素作为一组。然后，计算每一组的纹理，并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域，我们首先对较小的组进行分组。我们继续合并区域，直到所有区域都结合在一起。下图第一行展示了如何使区域增长，第二行中的蓝色矩形代表合并过程中所有可能的 ROI。

SelectiveSearch在一张图片上提取出来约2000个侯选区域，需要注意的是这些候选区域的长宽不固定。而使用CNN提取候选区域的特征向量，需要接受固定长度的输入，所以需要对候选区域做一些尺寸上的修改。

2.3 特征向量训练分类器SVM

假设原图片有2000个候选区，将其输入进一个CNN中(进行卷积、池化…得到各种抽象的特征)，输出2000×4096的特征向量。此时找到N个(需要分类多少个找多少个，如分为20类)SVM分类器，每个分类器都会对2000个候选区域的特征向量分别判断一次，即2000×4094的特征向量分别与N个不同类的SVM分类器，每个分类器都会对2000个候选区域的特征向量分别判断一次，，这样得出[2000, N]的得分矩阵，

每个SVM分类器做的事情
– 判断2000个候选区域是某类别，还是背景

2.3 非最大抑制（NMS）

NMS首先会对检测宽概率值进行排序，选出得分最高的，然后再计算LU面积大（也就是重叠率高）那些框进行删除。面对还有一些没有处理过的检测框再重新进行排序，然后选出得分最高的的，然后再计算这个同其他检测框的的LU面积，然后将LU面积大于某些预值的框进行删除，不断迭代，直到所有框都被处理过，输出最终框。
NMS改进的算法soft-NMS:认为直接通过采用预值进行判断太粗暴，变成了检测框位置的调整，对于低检测率的也能保证物体的性能。
二、目标检测算法之R-CNN

2.4 R-CNN测试过程

输入一张图像，利用selective search得到2000个region proposal。
对所有region proposal变换到固定尺寸并作为已训练好的CNN网络的输入，每个候选框得到的4096维特征
采用已训练好的每个类别的svm分类器对提取到的特征打分，所以SVM的weight matrix（权重矩阵）是4096xN，N是类别数，这里一共有20个SVM，得分矩阵是2000×20
采用non-maximun suppression（NMS）去掉候选框
得到region proposal（oU超过某个阈值且IOU最大）进行边框回归。
参考链接：https://www.cnblogs.com/kongweisi/p/10895055.html

Original: https://www.cnblogs.com/GengGengTongXue/p/16731844.html
Author: 耿耿同学
Title: 二、目标检测算法之R-CNN

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/804801/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas DataFrame 按照30s 向下取整

print(ss[‘time’]) 0 2014-01-21 03:31:111 2014-01-21 04:53:552 2014-01-21 05:16:183 2014-01…

Python 2023年8月8日
0040
软件测试分类概述

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Python 2023年6月6日
0066
python: float64与float32转换、压缩比较与转换偏差

python原生类型中只有float,并没有float64和float32，但是在numpy中是有float64和32区分的。因此，互转是需要在特定的库下面进行，比如，numpy和…

Python 2023年8月16日
00147
【课程笔记】中科大信息论（六）

这部分属于信息论与统计学相结合的部分，类似于机器学习的”隐变量”推断，即通过观测到的值来推测真实的信息。相对于机器学习喜欢提出具体的推断方法，信息论更关注…

Python 2023年10月26日
0043
python剔除列表异常值_Python数据分析处理（一）——处理剔除异常值以全国数学建模（CUMCM 2011 A题）为实例…

版权声明：本文为博主原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/zhr103063559…

Python 2023年8月21日
0076
Navicat Premium15 解决只能显示前1000条记录问题

Navicat Premium15 解决只能显示前1000条记录问题最近使用Navicat Premium15图形化界面操作MySQL的数据库，发现在超过1461条记录的表里，只…

Python 2023年6月11日
00287
tensorflow使用笔记

张量：张量是一个多维数组，与numpy ndarray相似有一维张量、二维张量，三维张量等等张量创建在构建的时候整形默认是int32,浮点型默认是float32 impor…

Python 2023年8月30日
0054
Python 與數據資料分析2.2-Matplotlib.pyplot 之動畫

“Talk is cheap. Show me the code.”― Linus Torvalds 老子第41章上德若谷大白若辱大方無隅大器晚成大音希聲大…

Python 2023年9月2日
0086
笔记篇二：鸢尾花数据集分类

目录一、鸢尾花数据集二、逻辑回归分析三、逻辑回归实现鸢尾花数据集分类四、散点图绘制一、鸢尾花数据集 1、问题 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习…

Python 2023年10月26日
0067
scrapy mysql pipeline_Scrapy用Pipeline写入MySQL

–– coding: utf-8 –– Define your item pipelines here Don’t fo…

Python 2023年10月6日
0031
python画图设置彩色线条_matplotlib学习——设置线条颜色及形状

在图形表示中，不同的画布或画布中不同的函数，我们常常要用不同的形状或颜色来区分开，这里小编向大家介绍这些参数的表示方法；一、控制颜色 b–blue c–c…

Python 2023年9月3日
0071
Python爬虫超详细讲解，零基础入门，老年人都看得懂

Original: https://www.cnblogs.com/pythonQqun200160592/p/15529955.htmlAuthor: python可乐编程Tit…

Python 2023年5月25日
0086
自制文档格式转换器，支持 .txt/.xlsx/.csv格式转换…

最近看到市场上各种的文档格式转换软件，要么是收费、要么是有大量的广告。于是学习了一下 PyQt5 的页面操作，再加上了解 pandas 的使用方法。所以，萌生了想法写一个简单的文档…

Python 2023年5月24日
0088
pandas读取行列数据-详细介绍(连续&不连续)

pandas读取行列数据-详细介绍 1、按行读取（单行，多行连续，多行不连续） 2、按列读取（单列，多列连续，多列不连续） 3、部分不连续行不连续列 4、按位置（坐标），按字符（索…

Python 2023年8月6日
0047
【Pygame系列】别样的飞机大战：太空陨石VS大型战机对决（内含源码）

导语 12月的心境：一半优，一半喜。 12月的天空：一半晴，一半雨。 12月的风：已不再那么的轻柔，带有无言的烦躁！甚至裹着疼痛的雨。 2022年的尾巴：已悄悄来…

Python 2023年9月21日
0051
千万不要点进来！看完Python从入门到实践，你就要走上秃头的道路

前言本文适用人群本文的设计主要是针对对编程有兴趣且没有任何编程经验的人，只要您想要接触编程领域，尝试自已编写代码开发程序，那本文一定是好的选择。如果您有一定的编程基础，想要在…

Python 2023年9月24日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

二、目标检测算法之R-CNN

1、R—CNN发展过程和各自的优缺点

1.1 R-CNN

（1）R-CNN原理

（2）R-CNN缺点

1.2 Fast R-CNN

（1）Fast R-CNN原理

（2）Fast R-CNN优缺点

1.2 Faster R-CNN

（1）Faster R-CNN原理

（2）Faster R-CNN优缺点

2、R-CNN算法原理

2.1R-CNN步骤

2.2 候选区域

2.3 特征向量训练分类器SVM

2.3 非最大抑制（NMS）

2.4 R-CNN测试过程

大家都在看