在卷积神经网络中，张量扮演着什么角色

2024年1月1日下午7:38 • 人工智能 • 阅读 38

问题背景

在卷积神经网络(Convolutional Neural Network, CNN)中，张量在模型的各个层之间传递并扮演关键角色。本文将详细阐述张量在CNN中的作用，并通过算法原理、公式推导、计算步骤和复杂Python代码示例进行解释。

张量在卷积神经网络中的作用

张量是多维数组的广义化概念，可以表示为具有固定形状且包含数字元素的数据结构。在CNN中，张量用于存储和传递网络的输入数据、中间特征图和输出结果。具体而言，张量在CNN中扮演以下角色：

输入数据：在CNN中，输入数据通常表示为一个四维张量，维度为[批量大小, 通道数, 图像高度, 图像宽度]。这里的通道数表示图像的颜色通道数量，如RGB图像的通道数为3。输入数据是模型的输入，通过网络的不同层进行处理和特征提取。
中间特征图：CNN中的每个层都会生成一个或多个中间特征图。特征图是网络层的输出结果，用于捕捉输入数据中的底层和高级特征。中间特征图是一个四维张量，维度与输入数据相似，例如[批量大小, 特征图通道数, 特征图高度, 特征图宽度]。
卷积核：卷积神经网络中使用卷积核进行特征提取和信息过滤。卷积核是一个张量，通常为四维张量，维度为[输出通道数, 输入通道数, 卷积核高度, 卷积核宽度]。通过对输入数据或中间特征图进行卷积操作，可以得到新的特征图。
输出结果：最后一个卷积层之后，通常会通过全连接层或其他类型的层生成网络的最终输出结果。输出结果可能是一个分类概率分布，也可能是一个回归值。输出结果通常表示为一个二维张量，维度为[批量大小, 输出维度]。

因此，张量在CNN中起到了传递和存储输入数据、特征图和输出结果的关键作用。

算法原理

卷积神经网络采用卷积操作来捕捉输入数据的局部特征，并通过权重共享和池化操作来减少模型的参数数量。以下是CNN的基本算法原理：

卷积层：卷积层使用一组可学习的卷积核对输入数据进行滑动窗口操作，生成一组特征图。卷积核在输入数据上滑动，计算输入数据和卷积核的元素逐点乘积之和，并将结果存储在特征图中。卷积操作可以有效地捕捉输入数据的局部特征。
激活函数：每个卷积层通常会在卷积操作后应用一个非线性激活函数，例如ReLU函数。激活函数对特征图中的每个元素进行非线性映射，引入了非线性关系，并有助于提取更高级别的特征。
池化层：池化层用于减少特征图的维度，并对特征图进行下采样。最大池化是最常见的池化操作，它将特征图分割成不重叠的矩形区域，并对每个区域内的最大值进行采样。通过池化操作，网络可以减少参数数量，减轻过拟合，并保留对输入数据的重要特征。
全连接层：在卷积层之后，通常会添加一个或多个全连接层，将特征图转换为最终的输出结果。全连接层的神经元与前一层中的所有神经元相连接，通过矩阵乘法和激活函数计算输出结果。

公式推导

卷积操作公式：

对于输入数据张量（通道数为C，高度为H，宽度为W）和卷积核张量（输入通道数为C，输出通道数为O，核高度为KH，核宽度为KW），卷积操作的输出特征图张量可以表示为：

$$
\text{output}(b, o, h, w) = \sum_{c=0}^{C-1} \sum_{i=0}^{KH-1} \sum_{j=0}^{KW-1} \text{input}(b, c, h+i, w+j) \cdot \text{kernel}(o, c, i, j) + \text{bias}(o)
$$

其中，$b$表示批量大小，$o$表示输出通道索引，$(h, w)$表示特征图上的像素位置。$\text{bias}(o)$是卷积操作的偏置项。

池化操作公式：

最大池化操作将特征图划分为不重叠的矩形区域，对于每个区域，池化操作选择该区域的最大值作为输出。池化操作的输出特征图张量可以表示为：

$$
\text{output}(b, c, h, w) = \max_{i=0}^{KH-1} \max_{j=0}^{KW-1} \text{input}(b, c, h \times s + i, w \times s + j)
$$

其中，$s$为池化层的步幅。

计算步骤

卷积神经网络的计算步骤如下：

定义并初始化卷积核张量和偏置项。
根据卷积操作公式，对输入数据和卷积核进行卷积操作得到输出特征图。
对输出特征图应用激活函数。
根据池化操作公式，对激活后的特征图进行池化操作得到下采样特征图。
迭代步骤2-4，直到达到预定的网络层数。
将最后一个卷积层或池化层的特征图展平为一维张量，并通过全连接层生成最终的输出结果。

复杂Python代码示例

下面给出一个复杂的Python代码示例，展示了一个包含卷积层和全连接层的CNN模型，并解释了代码的细节。

import torch
import torch.nn as nn

# 定义卷积神经网络模型
class CNN(nn.Module):
 def __init__(self):
 super(CNN, self).__init__()
 self.conv1 = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3, stride=1)
 self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)
 self.conv2 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=3, stride=1)
 self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
 self.fc = nn.Linear(32 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 6 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 6, 10)

 def forward(self, x):
 x = self.conv1(x)
 x = torch.relu(x)
 x = self.pool1(x)
 x = self.conv2(x)
 x = torch.relu(x)
 x = self.pool2(x)
 x = x.view(-1, 32 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 6 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 6) # 将特征图展平为一维张量
 x = self.fc(x)
 return x

# 实例化模型
model = CNN()

# 打印模型结构
print(model)

# 模拟输入数据
input_data = torch.randn(1, 3, 32, 32)

# 前向传播
output = model(input_data)

# 打印输出结果
print(output)

在这个示例中，我们定义了一个包含两个卷积层和一个全连接层的CNN模型。模型的输入数据为一个四维张量，大小为[1, 3, 32, 32]，模拟了一张RGB彩色图像。通过调用forward方法进行前向传播，模型输出一个二维张量，大小为[1, 10]，表示10个类别的概率分布。

代码细节解释

在代码示例中，我们使用了PyTorch深度学习框架来构建CNN模型。具体解释如下：

nn.Module是PyTorch中所有模型的基类，我们通过继承nn.Module来构建自定义模型。
nn.Conv2d是PyTorch中的卷积层类，用于定义卷积操作。我们根据网络结构定义了两个卷积层conv1和conv2。
nn.MaxPool2d是PyTorch中的最大池化层类，用于定义池化操作。我们根据网络结构定义了两个最大池化层pool1和pool2。
nn.Linear是PyTorch中的全连接层类，用于定义全连接操作。我们定义了一个全连接层fc，将最后一个卷积层或池化层的特征图展平为一维张量，并转换为最终的输出结果。
在forward方法中，我们实现了CNN模型的前向传播过程。通过调用各个层的前向传播方法，对输入数据进行卷积、激活、池化和全连接操作。
最后，我们实例化了CNN模型，并对一组模拟的输入数据进行前向传播，得到输出结果。

这个示例展示了一个简化的CNN模型的代码实现，以及使用PyTorch进行深度学习的基本模式。实际应用中，我们可以根据具体任务的需求和网络结构的复杂性，设计更加复杂和高效的CNN模型。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822880/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

字典和dataFrame的相互转换

字典和dataFrame的相互转换一、字典转dataFrame 1、字典转dataFrame比较简单，直接给出示例： import pandas as pd dic = { ‘n…

人工智能 2023年7月9日
0087
图像特征-Harris角点检测

1. 角点定义角点检测又称为特征点检测，是图像处理和计算机视觉中用来获取局部特征点的一类方法，广泛应用于运动检测、图像匹配、视频跟踪等领域。角点可以简单地定义为轮廓之间的交点，严格…

人工智能 2023年6月18日
0085
权重分析——CRITIC权重法

1、作用 CRITIC 权重法是一种客观赋权法。其思想在于用两项指标，分别是对比强度和冲突性指标。对比强度使用标准差进行表示，如果数据标准差越大说明波动越大，权重会越高；冲突性使用…

人工智能 2023年6月15日
00114
python音频频谱分析软件_SpectrumView(音频频谱分析软件)

SpectrumView是一款音频频谱分析软件，可以帮助用户分析音频，SpectrumView提供了傅立叶变换(FFT)显示、可变标记等功能，更方便用户使用，有需要可以下载。 Sp…

人工智能 2023年5月27日
0089
Deep Dream：理解深度神经网络结构及应用（实战篇）

慕课：《深度学习应用开发-TensorFlow实践》章节：第十一讲 Deep Dream：理解深度神经网络结构及应用TensorFlow版本为2.3 目录 Deep Dream…

人工智能 2023年5月26日
0082
tensorflow识别水果

人工智能 2023年5月26日
00102
TensorFlow安装步骤

环境：Win10，Python 3.8，Anaconda电脑：GeForce RTX 2060, NVIDIA CUDA 11.1.4官方教程：在 Windows 上安装 Tens…

人工智能 2023年6月16日
0092
tensorflow Lite 2—- 移动端部署–yolov5+训练自己的数据集

一、模型移动端环境部署可以参考： tensorflow lite 1—- 移动端部署–object detection 官方历程手把手教程_行码阁119的…

人工智能 2023年5月23日
0084
西瓜书–第五章.神经网络

个性签名：整个建筑最重要的是地基，地基不稳，地动山摇。而学技术更要扎稳基础，关注我，带你稳扎每一板块邻域的基础。博客主页：七归的博客创作不易，走过路过别忘了三连击了哟！！！关注作者…

人工智能 2023年7月14日
0067
gma 教程 | 气候气象 | 计算标准化降水指数（SPI）

目标【基于 Excel 降水和蒸散数据计算 SPI】【基于 GTiff 栅格降水和蒸散数据计算 SPI】环境系统： Window 10+ (X64)Python 版本： 3….

人工智能 2023年6月23日
0084
BM25算法

BM25算法 – 简书 BM25算法, Best Matching – 知乎 BM25是目前信息索引领域最主流的计算query与文档相似度得分的算法。BM …

人工智能 2023年7月18日
0074
终于有人把SaaS讲明白了

导读：如果把云计算简单想象成一台大电脑，那么IaaS是直接给你一台裸机，PaaS是安装好操作系统和基础运行环境再给你，而SaaS则很像网吧，你要玩的游戏已经装好在电脑里面，点击图标…

人工智能 2023年7月28日
0052
Docker配置深度学习pytorchgpu环境

一、docker的概念原理参考资料：https://zhuanlan.zhihu.com/p/81693661 https://www.zhihu.com/question/50…

人工智能 2023年7月24日
0080
使用CNN-XGboost模型进行恶意软件分类

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、介绍二、相关工作 * 2.1、传统方法 2.2、基于机器学习/深度学习的方法三、提出方案 * 1…

人工智能 2023年7月2日
0082
判别分析（1）——距离判别法

判别分析是多元统计分析的内容，其作用在分类确定的条件下，根据某一研究对象的各种特征的值来判断其归属于哪一类（即总体）。实际上，这一类问题就是根据已有的样本数据与对应的类别，判断未知…

人工智能 2023年7月2日
0065
DEFORMABLE DETR详解

1.解决问题 DETR 需要比现有的目标检测器更长的训练时间来收敛。 DETR在检测小物体方面的性能相对较低，并且无法从高分辨率特征地图中检测到小物体。可变形卷积可以识别重要特征…

人工智能 2023年6月17日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31