【深度学习】第四章：循环神经网络

2023年6月27日下午10:00 • 人工智能 • 阅读 63

文章目录

1. 为什么要使用循环神经网络？
2. 简单循环神经网络
3. 双向循环神经网络
4. 应用到机器学习
5. 参数学习
*
5.1 随时间反向传播算法（BPTT）
6. RNN的梯度爆炸与消失、长程依赖问题
7. 长短时记忆网络 (LSTM)
8. RNN vs CNN vs DNN
为什么要使用循环神经网络？

因为全连接神经网络存在如下缺点：

网络没有记忆：每次网络的输出只依赖于当前的输入，不能处理输入之间有联系的数据。
参数太多：层与层之间全连接，层内无连接。
无法处理变长的序列数据，如视频、语音、文本：因为输入和输出的维数都是固定的，不能任意改变。

其中，最主要的缺点还是第一点，输入之间没有联系，即网络没有记忆。那么 如何给网络增加记忆能力？ 有三种方法：

延时神经网络
自回归模型
循环神经网络

RNN主要用于解决输入之间具有时序关系的问题。

接下来介绍的就是其中的循环神经网络。

; 2. 简单循环神经网络

当隐藏层的个数不止一层时，就成了深度循环神经网络

双向循环神经网络

; 4. 应用到机器学习

序列到类别模式：输入是序列，输出是类别，用于解决分类问题。比如：文本分类、情感分类等
同步的序列到序列模式：主要用于序列标注任务，即每一时刻都有输入和输出，输入序列和输出序列的长度相同。比如：词性标注、中文分词、信息抽取等
异步的序列到序列模式：也称编码器-解码器模型，即输入序列和输出序列不需要有严格的对应关系，也不需要保持相同的长度。比如：机器翻译中，输入为源语言的单词序列，输出是目标语言的单词序列。
参数学习

可通过梯度下降的方法进行学习。主要有两种计算梯度的方式：

随时间反向传播算法（BPTT）
实时循环学习算法

5.1 随时间反向传播算法（BPTT）

主要思想是通过类似前馈神经网络的反向传播误差来计算梯度。过程如下：

前向计算激活值：在简单神经网络中提到过
反向传播误差

; 6. RNN的梯度爆炸与消失、长程依赖问题

梯度爆炸：靠近输入层的网络层，计算的到的偏导数极其大，更新后W变成一个很大的数(爆炸)。
梯度消失：靠后面网络层(如layer3)能够正常的得到一个合理的偏导数，但是靠近输入层的网络层，计算的到的偏导数近乎零，参数几乎无法得到更新。
长程依赖问题：RNN并不能很好的处理较长的序列。一个主要的原因是，RNN在训练中很容易发生 梯度爆炸和 梯度消失，这导致训练时梯度不能在较长序列中一直传递下去，从而使RNN无法捕捉到长距离的影响。

那么，如何避免 梯度爆炸和 梯度消失，从而解决RNN的长程依赖问题？

长短时记忆网络 (LSTM)

LSTM使用了三个门去控制LSTM的三个输入是否输入：
【深度学习】第四章：循环神经网络

门实际上就是一层全连接层，它的输入是一个向量，输出是一个0到1之间的实数向量。

; 8. RNN vs CNN vs DNN

DNN的代表是全连接神经网络，其层之间是全连接的，层内无连接。主要用于传统的机器学习，进行预测。
CNN是卷积神经网络，其层之间是局部连接的，层内无连接。主要用于处理图像分类
RNN是循环神经网络，其层之间是全连接的，层内是有连接的。主要用于解决时序数据的，比如语音识别、语言翻译等。

Original: https://blog.csdn.net/qq_43546676/article/details/127809724
Author: 别闹’
Title: 【深度学习】第四章：循环神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/655754/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV DNN模块常用操作

在实际利用opencv提供的dnn模块部署onnx格式的模型的时候，一些python端利用numpy可以简单轻易实现的操作，在C++端就得仔细考虑下实现的策略了。因为大多数并没有非…

人工智能 2023年7月18日
0052
iNeuOS工业互联网操作系统，增加DTU与平台实时交互的应用场景

目录概述… 2 平台演示… 2 硬件设置… 2 应用过程… 3 概述 DTU向下连接硬件传感器、向上与平台进行交互，但是DTU模…

人工智能 2023年6月4日
00100
数字图像处理——第三章灰度变换与空间滤波

目录 3.1 背景知识 3.2 一些基本的灰度变化函数 3.2.1 图像反转 3.2.2 对数变换 3.2.3 幂率（伽马）变换 3.2.4 分段线性变换函数 3.2.5 代码实现…

人工智能 2023年6月22日
0090
win10/win11+NVIDIA MX350笔记本自带显卡+CUDA10.2+Python3.6+Anaconda3从零开始配置深度学习环境

文章目录一、安装CUDA 二、安装cuDNN 三、安装Python 四、安装Anaconda3 五、配置其他环境一、安装CUDA 1. 打开英伟达控制面板。或在任务栏右下角，或…

人工智能 2023年7月22日
00100
符号回归工具之 geppy： Python中的基因表达编程框架

符号回归工具之 geppy： Python中的基因表达编程框架 geppy是一个专门用于基因表达编程（GEP）的计算框架，由 C. Ferreira 在 2001 年提出 [1]。…

人工智能 2023年6月16日
0078
python实现图像分割+代码+详解

一、资源包下载地址：二、安装但是出现了一点问题：我运行的时候一直显示错误找不到ffmpeg，明明我已经安装也配置了环境，特别奇怪。我一开始怀疑是自己路径传递出现了格式不正确的地…

人工智能 2023年7月5日
0082
js中的拖拽

拖拽基本实现思路（mouse事件替代）滑到盒子上，按住盒子；鼠标走，盒子拖着走；结束了，松开鼠标，即抬起； mousedown 按下 mousemove 跟着走 mouse…

人工智能 2023年6月28日
0088
机器学习系列(4)_数据分析之Kaggle鸢尾花iris

本篇博客参考：iris-经典案例解析-机器学习我们要解决的问题如下：已知鸢尾花iris分为三个不同的类型：山鸢尾花Setosa、变色鸢尾花Versicolor、韦尔吉尼娅鸢尾花V…

人工智能 2023年6月19日
0082
python机器学习 train_test_split()函数用法解析及示例划分训练集和测试集以鸢尾数据为例入门级讲解

文章目录 train_test_split()用法获取数据划分训练集和测试集完整代码脚手架 train_test_split()用法 python机器学习中常用 train_…

人工智能 2023年7月5日
0056
学生HTML个人网页作业作品 HTML+CSS校园环保(大学生环保网页设计与实现)

🎀 精彩专栏推荐👇🏻👇🏻👇🏻✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战案…

人工智能 2023年6月27日
0094
给课题组师弟师妹们的开荒手册

0 写在前面掐指算算，掐头去尾还有半年就要结束我的研究生生活了。翻看自己整个博客，每一篇都记录了自己跌跌撞撞的轨迹。犹记得研一时，由于gap一年导致丧失学习能力，计算机视觉课程大…

人工智能 2023年7月28日
0075
通俗易懂且全面的L2正则化（岭回归）解析

概述正则化的定义：减少泛化误差而不是训练误差，即避免过拟合。L2正则化（岭回归）：目标函数J ( θ ) = 1 m ∑ i = 1 m ( θ T ⋅ x ( i ) − y …

人工智能 2023年7月13日
0051
文本处理环境配置

第一步:安装相应软件根据自己电脑的配置去官网依次安装python、pycharm和anaconda,我自己的是macbook pro,自身没有GPU,但是我也用win,自己对比下…

人工智能 2023年5月24日
0092
多元时间序列预测之（三）基于图神经网络的Graph-Wavenet与MTGNN

文章目录 1.关于深度残差学习 2.Wavenet与TCN * 因果卷积与膨胀因果卷积残差连接与跳过连接 3.Graph-Wavenet 模型 * 图卷积层（GCN） 4.MTG…

人工智能 2023年7月12日
0058
Anaconda的使用

一、介绍conda 是开源包（packages）和虚拟环境（environment）的管理系统。packages 管理：可以使用 conda 来安装、更新、卸载工具包，并且它…

人工智能 2023年5月23日
0087
Python3人工智能学习笔记（二）——分类问题

3.1 分类问题实例对垃圾邮件进行检测任务输入：电子邮件输出：此为垃圾邮件/浦东邮件流程（人）标注样本邮件为垃圾/普通（计算机）获取匹配的样本邮件及其标签，学习其特…

人工智能 2023年7月2日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【深度学习】第四章：循环神经网络

文章目录

5.1 随时间反向传播算法（BPTT）

大家都在看