RNN详解

2023年5月28日上午8:56 • 人工智能 • 阅读 106

RNN（循环神经网络）详解

为什么要引入RNN？

我们可以把一个普通的神经网络当成一个能够你和任意函数的黑盒，只要训练的数据足够多，给定特定的x，我们就可得到希望的y。结构如下

该模型可以用于处理单独的一个一个的输入。但是，当我们处理序列信息时，即前面的输入跟后面的输入是有关系的，普通的神经网络模型就无法实现了。

以nlp中的一个词性标注任务来看：将” 我爱学习 “这句话进行词性标注时，学习这个词既可以当名词也可以当动词，单独标注的话很难确定。但是当我们用循环神经网络进行处理时，将 “爱” 处理为动词时，”学习” 这个词在在动词后面，它很大概率被处理为名词。

所以为了解决一些这样类似的问题，能够更好的处理序列的信息，RNN就诞生了。

; RNN的结构

RNN的结构跟普通的神经网络类似，由输入层、隐藏层、输出层组成。

U是输入层到隐藏层的权重矩阵。

V是隐藏层到输出层的权重矩阵。

与普通的全连接神经网络不同的是，循环神经网络的隐藏层S得知不仅取决于本次的输入X，还取决于上一次隐藏层的值S，W就是上一次隐藏层的值S作为本次输入的权值矩阵。

将上图按照时间线展开

用公式表示如下

BiRNN和DRNN

BiRNN（双向RNN）

虽然RNN达到了传递信息的目的，但是只是将上一时刻的信息传递到了下一时刻，也就是只考虑到了当前节点前的信息，没有考虑到该节点后的信息。具体到NLP中，也就是一句话，不仅要考虑某个词上文的意思，也还要考虑下文的意思，这个时候普通的RNN就做不到了。于是就有了双向RNN（Bidirectional RNN）。

上面是BiRNN的结构图，蓝框和绿框分别代表一个隐藏层，BiRNN在RNN的基础上增加了一层隐藏层，这层隐藏层中同样会进行信息传递，两个隐藏层值地计算方式也完全相同，只不过这次信息不是从前往后传，而是从后往前传，这样不仅能考虑到前文的信息而且能考虑到后文的信息了。

; DRNN

上图是DRNN的结构图，很简单，每一个红框里面都是一个BiRNN，然后一层BiRNN的输出值再作为另一个BiRNN的输入。多个BiRNN堆叠起来就成了DRNN。

Original: https://blog.csdn.net/qq_19830591/article/details/125951598
Author: 侯一鸣Supermonkey
Title: RNN详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530674/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言实例：基于Boston数据集的数据分析报告——用 logistic 回归、LDA（线性判别法）、K 临近法（k=1 和 k=5）构建分类模型。目的是预测一个区域的犯罪率是否高于所有犯罪率的中位数

文章目录问题 Boston 数据集 * 查看数据集数据描述构建分类模型 * 数据可视化 logistic 分类模型 – 构建分类模型的因变量构建三个不同自变量的…

人工智能 2023年7月1日
0094
python错误tensorflow.python.framework.errors_impl.InvalidArgumentError Assign requires shapes of both

错误tensorflow.python.framework.errors_impl.InvalidArgumentError: Assign requires shapes of …

人工智能 2023年5月24日
0097
再读HorNet论文

gnconv vision transformer是利用多头自注意力机制动态生成权重来混合空间标记（mix spatial tokens），但是自注意输入量的 quadratic …

人工智能 2023年6月25日
0076
Unity技术手册-UGUI零基础详细教程-ScrollBar和ScrollView

往期文章分享点击跳转=>《导航贴》- Unity手册，系统实战学习点击跳转=>《导航贴》- Android手册，重温移动开发本文约8千字，新手阅读需要20分钟，复…

人工智能 2023年7月29日
0076
关于Spyder报错‘NoneType‘ object has no attribute ‘shape‘解决

问题描述运行疲劳检测代码，Spyder关于 AttributeError: ‘NoneType’ object has no attribute ‘shape’问题，上网找了很多…

人工智能 2023年7月5日
00109
ROS学习（八）launch启动文件的使用方法

前言使用命令行输入代码需要不断打开终端比较繁琐，而且容易输入错误，那么有没有什么方法可以快速启动所需节点呢？一、launch文件介绍 Launch文件：通过XML文件实现多节点…

人工智能 2023年7月28日
0096
遥感图像超分辨重建综述

基于深度学习的遥感图像超分辨率重建技术综述摘要部分基于深度学习的遥感图像超分重建方法分成三大类单幅遥感图像超分重建最好的是基于GAN的方法方法：基于多尺度特征提取的方法…

人工智能 2023年7月27日
0056
MacOS下使用conda安装TensorFlow 并在pycharm中使用（亲测成功）

以下内容参考：一、下载tensorflow文件资源参考1 二、安装TensorFlow 注：文章里的要在python=3.8时使用/Users/dulei/Desktop/so…

人工智能 2023年5月24日
0089
r语言kmeans聚类_R语言做K均值聚类的一个简单小例子

参考链接 https://www.guru99.com/r-k-means-clustering.html https://datascienceplus.com/k-means-…

人工智能 2023年6月3日
0071
计算机视觉有关会议39个（进入计算机前200）

大致分一下，计算机视觉方向可投的会议一档： 1、CVPR，全称：IEEE/CVF Conference on Computer Vision and Pattern Recogn…

人工智能 2023年6月4日
0048
YOLOV7开源代码讲解–训练参数解释

目录训练参数说明： –weights: — cfg: –data: –hpy: –epoch: –batc…

人工智能 2023年7月29日
0083
loc和iloc用法辨析

在使用pandas对DataFrame对象进行列和行的选取的时候，经常会使用这样两种方法，他们分别是loc[]和iloc[]。首先，说明它们的具体用法： df.loc[] 只能使…

人工智能 2023年7月7日
0085
在运行yolo5的v5.0版本detect.py时遇到的一些错误

跟着小土堆的视频教学自己遇到的一些问题。出现错误的原因：由于yolov5目前最新版本为v6.1，但我跑的是5.0版本，则运行detect.py时自动从github上下载的训练好的…

人工智能 2023年6月23日
0095
MySQL之char、varchar类型简析

我们都知道，MySQL中关于字符，有char和varchar两种常用的类型，可能在平时的使用过程中，大家不会去关心这两种类型的区别，只是会用就可以了，或者说看到过一些它们的区别，但…

人工智能 2023年7月29日
0056
计算模型的GFLOPs和参数量 & 举例VGG16和DETR

近期忙于写论文，分享一下论文中表格数据的计算方法。一、FLOPS、FLOPs和GFLOPs的概念二、计算VGG16的GFLOPs和参数量三、计算DETR的GFLOPs和参数量…

人工智能 2023年7月26日
00138
【matlab图像处理】图像处理的加法运算

中国史之【成康之治】：成康之治指中国西周初周成王、周康王的治世。周成王继位时年幼，由周公旦摄政，平定三监之乱。周成王与其子周康王统治期间，国力强盛，文化昌盛，社会安定繁荣、百姓安居…

人工智能 2023年6月18日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31