深度理解感受野（一）什么是感受野？

2023年6月15日下午10:57 • 人工智能 • 阅读 101

Introduction

经典目标检测和最新目标跟踪都用到了RPN(region proposal network)，锚框(anchor)是RPN的基础，感受野(receptive field, RF)是anchor的基础。本文介绍感受野及其计算方法，和有效感受野概念

什么是感受野?

感受野与视觉

感受野(receptive field)这一概念来自于生物神经科学，是指感觉系统中的任一神经元，其所受到的感受器神经元的支配范围。感受器神经元就是指接收感觉信号的最初级神经元
视觉的产生来自于光在个体感受器上的投射，将客观世界的物理信息转换为人能感知的神经脉冲信号

感受野的定义

One of the basic concepts in deep CNNs is the receptive field, or field of view, of a unit in a certain layer in the network. Unlike in fully connected networks, where the value of each unit depends on the entire input to the network, a unit in convolutional networks only depends on a region of the input.

This region in the input is the receptive field for that unit.

在卷积神经网络中，感受野(receptive field)不像输出由整个网络输入所决定的全连接网络那样，它是可以存在于网络中任意某层，输出仅由输入部分决定
就是指输出feature map上某个元素受输入图像上影响的区域

如图所示，共有3个feature map输出。该图说明了2个33的conv可以代替1个55的conv层

Layer1中方格可看作是一个元素，33的绿色方格则是一个33的卷积核
Layer2由一个33的卷积核经过卷积运算输出，输出尺寸是33（假设stride=1，padding=0）显而易见，layer2中的绿色方格是由layer1中3*3的绿色方格所决定的。那么这一位置的感受野就是layer1中的绿色方格区域
Layer3由layer2经过3*3的conv层输出，只有一个

; 理论感受野

https://distill.pub/2019/computing-receptive-fields/

如何计算？

卷积层的理论感受野可以由递推公式计算出来。首先定义下参数意义，r r r代表感受野l l l代表层数k k k代表卷积核大小s s s代表步长
r l = r l − 1 + ( k l − 1 ) ∗ ∏ i = 0 l − 1 s i r_l = r_{l-1}+(k_l – 1)*\prod_{i=0}^{l-1}{s_i}r l =r l −1 +(k l −1 )∗i =0 ∏l −1 s i
最大池化层的理论感受野
r l = r l − 1 + ( k l − 1 ) r_l = r_{l-1}+(k_l – 1)r l =r l −1 +(k l −1 )

图中，由1个conv33（stride=1，pad=1），1个ReLu层，1个22MaxPooling层（k=2，s=2，p=0）组成。f 0 f_0 f 0 为输入层，f 4 f_4 f 4 层为输出层。很明显能够发现，f 4 f_4 f 4 层的感受野为6。推导过程如下

f 1 f_1 f 1 默认感受野为1，即r 0 = 1 r_0=1 r 0 =1
f 2 f_2 f 2 层为33conv层，r 1 = r 0 + ( k 1 − 1 ) ∗ ∏ i = 0 0 s 0 r_1=r_0+(k_1-1)\prod_{i=0}^{0}{s_0}r 1 =r 0 +(k 1 −1 )∗∏i =0 0 s 0 即r 1 = 1 + ( 3 − 1 ) ∗ 1 = 3 r_1=1+(3-1)*1=3 r 1 =1 +(3 −1 )∗1 =3
f 3 f_3 f 3 层为激活函数层ReLu，不改变理论感受野大小（也不是没作用，有效感受野里面会提到它的作用）r 2 = 3 r_2=3 r 2 =3
f 4 f_4 f 4 层为33conv层，和上一个conv层一样，r 3 = 3 + ( 3 − 1 ) ∗ 1 = 5 r_3=3+(3-1)1=5 r 3 =3 +(3 −1 )∗1 =5
f 5 f_5 f 5 层为22maxpooling层，r 4 = 5 + ( 2 − 1 ) ∗ 1 = 6 r_4=5+(2-1)1=6 r 4 =5 +(2 −1 )∗1 =6

按照上述方法可以计算出主流的backbone理论感受野大小，如下图所示。数据来自https://distill.pub/2019/computing-receptive-fields/

从感受野的计算公式很明显能够看出， stride kernel_size rf_size都会对其产生影响，其中 srtide对感受野大小起决定性作用。

; 有效感受野

有效感受野是在NIPS2016中的Understanding the Effective Receptive Field in Deep Convolutional Neural Networks提出的。

有效感受野是一种超参数， 无法像理论感受野那样被精确计算。但是文献[2]中采用求偏导数的方法对每个图像上的像素点，计算出他们对输出特征图的贡献值，并可视化。
有限感受野往往比理论感受野要小一些，关系大概是 anchor
有效感受野呈 高斯分布，并不是所有像素点的贡献都相同。直观的来说， *感受野中间的像素对于输出会有更大的影响

以下内容整理自：https://blog.csdn.net/DD_PP_JJ/article/details/104448825

采用不同初始化权重的方法和添加ReLU作为激活函数进行实验。Uniform初始化方法使卷积核的权重都为1，没有非线性性质。引入ReLU之后，网络中增加了非线性性，分布变得 a bit less Gaussian

不同的激活函数对ERF的分布也有影响，这说明ERF的分布也取决于 input。ReLU的高斯分布没有另外两个平滑，生成了一个较少的高斯分布，ReLU导致很大一部分梯度归零。上采样和空洞卷积可以增大感受野

文章中也给出了答案，见上图，随着网络层数的加深，实际有效的感受野是程n \sqrt{n}n 级别增长。而右图展示了随着网络层数的加深，有效感受野占理论感受野的比例是按照1 n \frac{1}{\sqrt{n}}n 1 级别进行缩减的。其中需要注意的是实际感受野的计算方式：若像素值大于(1-96.45%)的中心像素值，就认为该像素处于实际感受野中

哪些操作可以改变感受野？

Convolution
DeConvolution
Pooling
Residential connection
Concatenation

参考文献

[1] A guide to convolution arithmetic for deep learning
[2] Understanding the Effective Receptive Field in Deep Convolutional Neural Networks

Original: https://blog.csdn.net/weixin_40756000/article/details/117264194
Author: 黑夜里游荡
Title: 深度理解感受野（一）什么是感受野？

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/618056/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV-白平衡(灰度世界算法)

作者：翟天保Steven版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处实现原理白平衡的意义在于，对在特定光源下拍摄时出现的偏色现象，通过加强对应的…

人工智能 2023年5月26日
00120
Pyhton学习记录（二）利用鸢尾花进行简单数据分析

本文主要内容 1 导入本文所有需要的库 2 数据预处理 3 数据可视化 4 模型训练与测试 1 导入本文所有需要的库 from sklearn.datasets import lo…

人工智能 2023年7月15日
0091
关于yolov5的一些说明（txt文件、训练结果分析等）

一、yolo中txt文件的说明：二、yolo跑视频、图片文件的格式：三、yolov5训练结果不好的原因： 1. 欠拟合：在训练集上表现很差，测试集上表现也很差的现象可能是欠拟…

人工智能 2023年6月23日
0067
Teams app LukcyDraw 的升级之路

我已经有很长一段时间没有更新我的 Teams App：LuckyDraw 了，有很多用户反馈给我，因为快到圣诞，新年和春节了，很多公司都开始要使用LuckyDraw来搞抽奖活动，希…

人工智能 2023年7月30日
0074
C语言数字图像处理进阶—14 晕角滤镜

晕角(Halo)滤镜晕角滤镜是一种常见的图片修饰手法，表现出来就是给图像四个角添加暗影效果，这暗影向图像中心逐渐淡化。在各种主流图像处理软件中，都经常存在，而且备受欢迎。比如In…

人工智能 2023年6月22日
0088
深度学习第8天–线性模型1

重点1：一元线性回归与多元线性回归在记录这次学习笔记之前，先回顾一下线性模型的基本形式：在数学上，线性函数是只拥有一个变量的一阶多项式函数，我们把能够用f(ax+by)=af(x…

人工智能 2023年6月18日
00108
Descent）

人工智能 2024年1月1日
0040
python数据分析基础010 -利用pandas带你玩转excel表格（终篇）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月7日
0074
【YOLOv5-6.x】设置可学习权重结合BiFPN（Concat操作）

本文将尝试直接进行Concat操作来结合BiFPN。修改yaml文件（以yolov5s为例）本文以 yolov5s.yaml为例进行修改，原作者在YOLOv5-6.1版本中已经…

人工智能 2023年6月17日
0084
LIO-SAM从0到1运行自己的数据集

LIO-SAM从0到1运行自己的数据集前言笔者在学习LIO_SAM时踩了不少坑，在此记录从开始到最后整个踩坑过程。文中参考了很多大佬的文章，我只是个搬运工。可以直接跳到第二…

人工智能 2023年7月27日
0059
机器学习之深度学习简介

文章目录深度学习 * 1. 深度学习介绍 2. 深度学习原理 3. 深度学习实现深度学习 1. 深度学习介绍深度学习（Deep learning）是机器学习的一个分支领域,其…

人工智能 2023年7月28日
0059
【OpenCV-Python】：查找物体轮廓+计算轮廓面积、长度、重心

✨博客主页：米开朗琪罗~🎈✨博主爱好：羽毛球🏸✨年轻人要：Living for the moment（活在当下）！💪🏆推荐专栏：【图像处理】【千锤百炼Python】【深度学习】【排…

人工智能 2023年6月16日
00105
错误率、精度、查准率、召回率和F1得分

① 错误率与精度错误率和精度是分类问题中常用的性能度量指标，既适用于二分类任务，也适用于多分类任务. 错误率（error rate）：指分类错误的样本占样本总数的比例，即（分…

人工智能 2023年7月17日
0073
FPGA verilog 临近插值任意比例视频缩放代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/qq_46621272…

人工智能 2023年6月18日
00106
熬夜整理了2021年Python最新学习资料，分享给学弟学妹们【大学生必备】

Python最新学习资料和视频一、Python软件安装教程视频教程二、学习规划阶段一：Python基础阶段二：Python核心编程阶段三：web前端开发阶段四：数据…

人工智能 2023年6月15日
0055
PyTorch1.11.0 GPU版本安装（python3.8+pyTorch1.11.0，torch1.11.0+cu113 torchvision0.12.0+cu113）

目录一、电脑相关信息二、安装Pytorch1.11.0 GPU版本 1. 准备：新建虚拟环境 2. 安装pytorch v1.11.0：（在pytorch官网的历史版本里找安装…

人工智能 2023年7月20日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度理解感受野（一）什么是感受野？

感受野与视觉

感受野的定义

如何计算？

大家都在看