池化层与全局池化层有何区别

2024年1月4日上午10:16 • 人工智能 • 阅读 73

问题：池化层与全局池化层有何区别？

详细介绍

在深度学习中，池化层（Pooling Layer）和全局池化层（Global Pooling Layer）是两种常用的特征抽取方法。它们在卷积神经网络（CNN）中扮演着重要的角色，用于减少输入数据的空间维度，提取出主要特征。

池化层通常放置在卷积层之后，在特征图上进行子采样。它通过滑动窗口在输入数据的不同位置提取窗口内的最大值或平均值，并将其作为输出特征图的一个像素值。与卷积层相比，池化层没有需要学习的参数。

全局池化层与池化层相比，更加简化了特征图的降维操作。它对整个特征图进行操作，将特征图的所有像素值进行池化得到一个数值。因此，全局池化层将输入特征图的二维形状（宽度和高度）转换为一个一维的向量。

算法原理

在介绍算法原理之前，我们先定义一些符号:
– 输入特征图：$X \in \mathbb{R}^{H \times W \times C}$，其中$H$、$W$和$C$分别表示特征图的高度、宽度和通道数。
– 池化核大小：$k$，通常由用户预先指定。

池化层的算法原理

对于池化层，最常见的是最大池化和平均池化两种方式。以最大池化为例，其算法原理如下：
1. 在输入特征图上通过一个大小为$k \times k$的滑动窗口（通常滑动步长为1）进行移动。
2. 在每个滑动窗口上提取窗口内的最大值作为对应位置的输出特征图的像素值。

平均池化同理，只不过提取窗口内的是平均值。

全局池化层的算法原理

与池化层不同，全局池化层不需要指定池化核的大小。其算法原理如下：
1. 对输入特征图的每个通道，计算所有像素值的平均值或最大值（根据具体问题而定）。
2. 将每个通道的池化结果拼接起来，形成一个一维的向量作为输出结果。

公式推导

池化层的公式推导

最大池化和平均池化可以用以下公式表示：
– 最大池化：$$Y(i, j, c) = \max_{m,n}(X(s \cdot i+m, s \cdot j+n, c))$$其中$0 \leq m, n < k$，$Y \in \mathbb{R}^{\frac{H}{s} \times \frac{W}{s} \times C}$为输出特征图，$s$为池化层的步长。
– 平均池化：$$Y(i, j, c) = \frac{1}{k^2}\sum_{m=0}^{k-1}\sum_{n=0}^{k-1}(X(s \cdot i+m, s \cdot j+n, c))$$

全局池化层的公式推导

全局池化层在每个通道上的运算可以表示为：
– 最大池化：$$\text{max_pool}(X, c) = \max(Y(1, 1, c), Y(1, 2, c), …, Y(H, W, c))$$其中$1 \leq c \leq C$。
– 平均池化：$$\text{avg_pool}(X, c) = \frac{1}{H \cdot W}\sum_{i=1}^{H}\sum_{j=1}^{W}(Y(i,j,c))$$

计算步骤

对于池化层，依次通过滑动窗口获取窗口内的最大值或平均值，得到输出特征图。
对于全局池化层，每个通道上提取最大值或平均值，得到一个特征向量。

复杂Python代码示例

下面是一个Python代码示例，使用TensorFlow框架实现了池化层和全局池化层的操作。

import tensorflow as tf

# 输入特征图
input = tf.placeholder(tf.float32, shape=[None, H, W, C])

# 池化层
max_pool_output = tf.nn.max_pool(input, ksize=[1, k, k, 1], strides=[1, s, s, 1], padding='SAME')
avg_pool_output = tf.nn.avg_pool(input, ksize=[1, k, k, 1], strides=[1, s, s, 1], padding='SAME')

# 全局池化层
global_max_pool_output = tf.reduce_max(input, axis=[1, 2])
global_avg_pool_output = tf.reduce_mean(input, axis=[1, 2])

代码中，input为输入特征图，max_pool_output和avg_pool_output分别表示池化层的最大池化和平均池化结果，global_max_pool_output和global_avg_pool_output分别表示全局池化层的最大池化和平均池化结果。

代码的执行步骤如下：
1. 定义输入特征图。
2. 调用TensorFlow提供的池化函数进行池化操作，其中ksize为池化核的大小，strides为池化的步长，padding为填充方式。
3. 调用TensorFlow提供的全局池化函数进行全局池化操作，其中reduce_max和reduce_mean用于计算最大值和平均值。

代码细节解释

在代码示例中，我们使用了TensorFlow框架提供的函数来实现池化层和全局池化层的操作。具体解释如下：

tf.nn.max_pool函数用于进行最大池化操作。其中，ksize参数指定池化核的大小，strides参数指定池化的步长，padding参数指定填充方式。
tf.reduce_max函数用于计算输入张量在指定维度上的最大值。在我们的例子中，我们使用它来实现全局池化层的最大池化操作。axis参数指定进行最大值计算的维度。
同理，tf.nn.avg_pool函数和tf.reduce_mean函数分别用于进行平均池化操作和计算平均值。

这个示例提供了池化层和全局池化层的使用方法，你可以根据实际需求调整相关参数来应用于你的问题中。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823760/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【计算机视觉】数字图像处理（五）—— 图像的退化与复原

数字图像处理（五）—— 图像的退化与复原 * – 一、图像退化 – + 图像退化的定义： – 二、图像复原 – + （一）、图像复原…

人工智能 2023年5月28日
0075
自动驾驶决策规划控制工程师技术要求

具体要求 1.首先作为自动驾驶从业人员一定要学习自动驾驶平台，如开源的百度apollo，apollo具有大量的开源资料和仿真平台，为无车的大家提供了一个很好的学习平台，通过apol…

人工智能 2023年6月10日
0067
留学、科研、文献调研三部曲

一、科研趋势分析 直接上神器，&#x8F…

人工智能 2023年6月10日
00103
PMP每日一练 | 考试不迷路-11.12（包含敏捷+多选）

11.27PMP考试倒计时 15天每日5道PMP习题助大家上岸PMP！题目1-2： 1.在项目的中途，产品负责人从发起人那里了解到：有一个主要组件，它已经完成了 20%，但…

人工智能 2023年6月27日
0075
SCI论文与博士论文的关系（一）

1、小皮埃：SCI数量和博士论文的水平没有必然的联系博士大论文更能直观的反映博士水平，这里面包含了你从头到尾完成一个课题的所有：文献调研、预实验、假设的提出、实验的设计、实验结果…

人工智能 2023年6月10日
0056
AI艺术的背后：详解文本生成图像模型【基于 Diffusion Model】

系列文章链接： AI艺术的背后：详解文本生成图像模型【基于 VQ-VAE】AI艺术的背后：详解文本生成图像模型【基于GAN】AI艺术的背后：详解文本生成图像模型【基于Diffusi…

人工智能 2023年6月23日
00120
轻量级模型YOLOv5-Lite基于自己的数据集【焊接质量检测】从零构建模型超详细教程

YOLO系列是目标检测任务中非常非常出色的模型，在v3-v5的演变过程中，不断地吸收集成融合各种好的tricks，模型的性能也得到了很大的提升。在YOLOv5时期一度达到了鼎盛的阶…

人工智能 2023年6月17日
00135
【DEBUG】解决pandas与numpy版本不协调导致的：Unable to import required dependencies: numpy: DLL load failed找不到指定的模块

Traceback (most recent call last):File “D:\hq_test.py”, line 74, infrom pytdx….

人工智能 2023年7月5日
0070
机器学习笔记1.1-回归(regression)

监督学习-Regression 一：模型搭建（初始版)这里采用的模型：sklearn.linear_model import LinearRegression sklearn 库中…

人工智能 2023年6月17日
0079
CS224N WINTER 2022（一）词向量（附Assignment1答案）

lecture 1 词向量两篇推荐阅读都是2013年的paper：理论内容大部分已在slides与notes部分详细阐述（在 lecture2中也有对这两篇paper的内容有所…

人工智能 2023年7月16日
0073
【计算机科学前沿】第五章答案 2022 – 图像处理

5.1 图像的像素和色彩 fig() + image(img_gray, cmap=’gray’) print(type(img_gray)) print(img_gray.sha…

人工智能 2023年7月28日
0075
神经网络与深度学习（nndl）——2 机器学习概述

机器学习概述机器学习（ML）定义：就是 让计算机从&#x65…

人工智能 2023年7月14日
0077
相机校准—外参矩阵

在本文中，我们将探讨摄影机的外参，并通过Python中的一个实践示例来加强我们的理解。相机外参摄像头可以位于世界任何地方，并且可以指向任何方向。我们想从摄像机的角度来观察世界上…

人工智能 2023年6月15日
0067
Verilog语言编写 RGB文件转YCbCr模块

YCbCr是色彩空间的一种，通常会用于影片中的影像连续处理，或是数字摄影系统中。Y(luminance)为颜色的亮度和浓度、Cb（chrominance-blue）为蓝色色度分量，…

人工智能 2023年6月22日
0063
实验舱DS1班笔记DAY2

此文章主要为Pandas 一. df.shape 它出现的是一个元组，例如（800，13）。如果你想要取出其中一个数据，比如800，要运用方括号[0]；如果是13，要运用方括号[1…

人工智能 2023年7月8日
00105
Python+OpenCV实用案例应用教程：建立自定义物体检测器

本章将深入探讨物体检测的概念，这是计算机视觉中最常见的挑战之一。既然在这本教程中已经讲了很多内容了，读到这里，你也许会想，什么时候才能把计算机视觉应用实践中呢。你是否想过建立一个系…

人工智能 2023年7月19日
0048

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31