基于pytorch的ConvGRU神经网络的实现与介绍

2023年7月14日上午4:00 • 人工智能 • 阅读 111

基于pytorch的ConvGRU神经网络的实现与介绍

1.卷积神经网络介绍

卷积神经网络(convlutional neural network)是一种具有局部连接，权重共享等特性的深层前馈神经网络
特点：
- 局部连接：
- 在卷积层中每一个神经元都只和前一层中的某个局部窗口内的神经元相连，构成一个局部神经网络
- 权重共享
- 参数的卷积核w ( l ) w^{(l)}w (l )对于第l层的所有神经元都是相同的
- 汇聚
优点：平移、缩放、旋转不变性
组成：目前卷积神经网络一般由卷积层、汇聚层和全连接层交叉堆叠而成
- 卷积层：
- 提取局部区域的特征，不同的卷积核相当于不同的特征提取器
- 特征映射：输入经过卷积提取到的特征，每个特征映射可以作为一类 抽取的图像特征
程序实现：
- 在pytorch中卷积层的实现方式为加载torch.nn.nn中的函数进行实现
- 调用函数为nn.conv2D
- in_channels: 输入的通道数量
- out_channels：输出的通道数量
- kernel_size：卷积核尺寸
- stride：步长
- padding(补0)：控制zero-padding的数目
- 输入输出说明：
- 输入的变量的维度应该为（batch_size, in_channels, width, length）
- 输出的为

import torch
import torch.nn as nn
conv = nn.Conv2d(in_channels=1,out_channels =16, kernel_size=3, stride =1)
inputs = torch.randn(1, 1, 64, 64)
out = conv(inputs)

2.循环神经网络

GRU神经网络是一种循环神经网络，是LSTM的变种，在LSTM神经网络的基础上优化了cell结构减少了参数，加快了训练速度；
LSTM的计算公式为：
其中 f 为遗忘门，决定前一层传递过来的多大程度被遗忘掉
i 为输入门，控制当前计算的新状态多大程度更新到记忆细胞中
o 为输出门，控制当前输出有多大程度取决于当前的记忆单元
c 为记忆单元，可以看出细胞状态是有权重、输入、上一层的隐含层输入、上一层的记忆单元状态、输入门综合计算得到的
本层的隐含层状态则是由输出门与记忆细胞状态决定的
GRU的计算公式为：
GRU摒弃了LSTM中的记忆单元，并将输入门和遗忘门结合成了更新门（update gate）
z 为更新门，决定有多少迁移一层的状态要更新当前神经元中
h ^ \hat{h}h ^为隐含层候选值，但是从最后一个函数可以看出，隐含层的候选值需要使用更新门来进行计算更新
LSTM和GRU的实现
pytorch中提供了 LSTM和GRU的实现方式
- 参数
  – input_size
  – hidden_size
  – num_layers
  – bias
  – batch_first
  – dropout
  – bidirectional
- 输入
  – input (seq_len, batch, input_size)
  – h_0 (num_layers * num_directions, batch, hidden_size)
  – c_0 (num_layers * num_directions, batch, hidden_size)
- 输出
  – output (seq_len, batch, num_directions * hidden_size)
  – h_n (num_layers * num_directions, batch, hidden_size)
  – c_n (num_layers * num_directions, batch, hidden_size)

rnn = nn.LSTM(input_size=10, hidden_size=20, num_layers=2)
input = torch.randn(5, 3, 10)
h0 = torch.randn(2, 3, 20)
c0 = torch.randn(2, 3, 20)
output, (hn, cn) = rnn(input, (h0, c0))

3. ConvGRU介绍

ConvGRU是根据施博士的ConvLSTM进行了修改，将LSTM转化为了GRU进行计算。ConvLSTM是使用卷积核代替LSTM中的全连接层，即将 全连接变为局部连接，使用GRU进行对比，基于torch进行计算，传统的GRU用torch表示前向传播过程为：

import torch
import torch.nn as nn
import torch.nn.functional as F

def GRU_forward(x, h_t_1):
    """GRU流程
    args:
        x: input
        h_t_1: 上一层的隐含层输出值
    shape：
        x: [1, feature_size]
        h_t_1: [hidden_size, hidden_size]
"""
    linear_x_z = nn.Linear(10, 5)
    linear_h_z = nn.Linear(5, 5)
    linear_x_r = nn.Linear(10, 5)
    linear_h_r = nn.Linear(5, 5)
    z_t = F.sigmoid(linear_x_z(x) + linear_h_z(h_t_1))
    r_t = F.sigmoid(linear_x_r(x) + linear_h_r(h_t_1))
    linear = nn.Linear(10,5)
    linear_u = nn.Linear(5,5)
    h_hat_t = F.tanh(linear(x) + linear_u(torch.mul(r_t, h_t_1)))
    h_t = torch.mul((1 - z_t), h_t_1) + torch.mul(z_t, h_hat_t)
    linear_out = nn.Linear(5, 1)
    y = linear_out(h_t)
    return y, h_t

x = torch.randn(1,10)
h_t_1 = torch.randn(5,5)

y, h = GRU_forward(x, h_t_1)

而在ConvGRU中上述的linear层全部会转化为conv层且输入变量会发生变化，传统GRU中输入的为二维变量，而在ConvGRU中输入的为三维变量，convGRU的前向传播过程如下：

def convGru_forward(x, h_t_1):
    """GRU卷积流程
    args:
        x: input
        h_t_1: 上一层的隐含层输出值
    shape：
        x: [1, channels, width, lenth]
"""
    conv_x_z = nn.Conv2d(
                in_channels=1, out_channels=4, kernel_size=1, stride=1)
    conv_h_z = nn.Conv2d(
                in_channels=4, out_channels=4, kernel_size=1, stride=1)
    z_t = F.sigmoid(conv_x_z(x) + conv_h_z(h_t_1))

    conv_x_r = nn.Conv2d(
                in_channels=1, out_channels=4, kernel_size=1, stride=1)
    conv_h_r = nn.Conv2d(
                in_channels=4, out_channels=4, kernel_size=1, stride=1)
    r_t = F.sigmoid((conv_x_r(x) + conv_h_r(h_t_1)))

    conv =  nn.Conv2d(
                in_channels=1, out_channels=4, kernel_size=1, stride=1)
    conv_u =  nn.Conv2d(
                in_channels=4, out_channels=4, kernel_size=1, stride=1)

    h_hat_t = F.tanh(conv(x) + conv_u(torch.mul(r_t, h_t_1)))

    h_t = torch.mul((1 - z_t), h_t_1) + torch.mul(z_t, h_hat_t)
    conv_out = nn.Conv2d(
                in_channels=4, out_channels=1, kernel_size=1, stride=1)
    y = conv_out(h_t)
    return y, h_t

x = torch.randn(1, 1, 16,16)
h_t_1 = torch.randn(1, 4, 16, 16)
y_3, h_3 = convGru_forward(x, h_t_1)

print(y_3.size())

Original: https://blog.csdn.net/qq_34992900/article/details/119514362
Author: orient2019
Title: 基于pytorch的ConvGRU神经网络的实现与介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691253/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)

这是我翻译这位大佬的第二篇文章了，翻译授权见最后。其他工作：图解transformer | The Illustrated Transformer 图解BERT、ELMo（NL…

人工智能 2023年5月30日
0086
pytorch 之tensor的基础知识

一、 PyTorch中， Tensor 和 tensor 首先，我们需要明确一下， torch.Tensor()是python 类，更明确地说，是默认张量类型torch.Float…

人工智能 2023年6月17日
0070
pytorch pso优化cnn-lstm 智慧海洋-渔船轨迹识别

1、摘要本文主要讲解：pytorch pso优化cnn-lstm 智慧海洋-渔船轨迹识别主要思路：根据经纬度和时间序列创建时序块数据集随机分成训练和测试定义PSO Para…

人工智能 2023年6月29日
00103
MATLAB图像的中值滤波——手动滤波和medfilt2函数滤波

本文还是书接上回，https://blog.csdn.net/weixin_44502554/article/details/126283957?spm=1001.2014.300…

人工智能 2023年6月17日
0096
Web前端：雇佣全栈开发者有哪些好处?

在今天的竞争中，技术企业家要求开发者不仅仅是某一特定技术的专家。科技行业需要全球化和统一化，这时全栈开发人员出现了。全栈开发人员可以执行所有前端、后端、数据库和其他一切。商业和企…

人工智能 2023年6月27日
0093
工业相机飞拍模式介绍及相机曝光值计算

1.检测原理 (一)原理飞拍就是使用硬件比较输出或精准输出端口在极短时间内触发相机拍照，而被测物品在拍照过程中仍处于运动状态，与此同时被测物品通过图像处理软件计算出其位置的偏移量…

人工智能 2023年7月27日
0096
ElasticSearch

title: ElasticSearch [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GiF2jnew-1668231135575)(https:…

人工智能 2023年6月28日
0076
Pytorch lr_scheduler.LambdaLR()的简单理解与用法

官方文档：https://pytorch.org/docs/1.10.1/generated/torch.optim.lr_scheduler.LambdaLR.html 在pyt…

人工智能 2023年7月21日
00110
ROS图像的Deeplab v3+实时语义分割（ROS+Pytorch）

目录写在前面测试环境主要思路正式开始 * 代码获取代码编译代码使用结果展示写在前面做机器人的同学们应该都知道，ROS是最常用的系统。一般搭载在机器人上的传感器也通…

人工智能 2023年6月10日
00121
python apply函数参数_python-使用pandas.Series.apply时自定义函数中的参数

这是一个简单的 pandas dataframe ,定义如下： df = pd.DataFrame( { ‘word’: [‘flower&#8…

人工智能 2023年7月8日
0051
Python精讲：在Python中遍历字典的三大方法详解

欢迎你来到站长在线的站长学堂学习Python知识，本文学习的是《在Python中遍历字典的三大方法详解》。本知识点主要内容有：使用字典对象的items()方法可以遍历字典的项和字典…

人工智能 2023年7月6日
0077
regexp_extract用法

函数：regexp_extract(str, regexp[, idx]) —-字符串正则表达式解析函数参数解释:其中：str是被解析的字符串或字段名 regexp 是…

人工智能 2023年6月27日
00127
【ROS】OpenCV+ROS 实现人脸识别（Ubantu16.04）

目录前言一、环境配置 1.安装ROS 2.摄像头调用 3.导入OpenCV 二、创建工作空间和功能包 1.创建工作空间 2.创建功能包三、人脸识别检测相关代码 1.pytho…

人工智能 2023年7月28日
0075
Pytorch深度学习基础实战天气图片识别（基于ResNet50预训练模型，超详细）

文章目录一、概述二、代码编写 * 1. 数据处理 2. 准备配置文件 3. 自定义DataSet和DataLoader 4. 构建模型 5. 训练模型 6. 编写预测模块三、…

人工智能 2023年7月26日
0082
python回归取残差_如何用sklearn拟合线性回归后的残差方差

让我们来定义一下y_true = np.array([3, -0.5, 2, 7]) y_pred = np.array([2.5, 0.0, 2, 8]) 平均绝对误差可定义为 …

人工智能 2023年6月18日
0082
深度学习Tensorflow的坑（一：无法使用GPU加速训练深度学习模型，CUDA与CUDNN相关）

故事背景：本研究僧为了秋招卷大厂放弃了半年的深度学习，重回Python的一些坑记录。其实最后也没有去大厂，感觉自己还是想要WLB，>. Original: https://…

人工智能 2023年5月26日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于pytorch的ConvGRU神经网络的实现与介绍

基于pytorch的ConvGRU神经网络的实现与介绍

1.卷积神经网络介绍

2.循环神经网络

3. ConvGRU介绍

大家都在看