一幅图真正理解LSTM、BiLSTM

2023年5月31日上午4:55 • 人工智能 • 阅读 98

3.2 看1层的 BiLSTM 是如何运转的

3.3 看2层的 BiLSTM 是如何运转的

1 前言

本文对RNN、LSTM、BiLSTM的内部结构和输入输出做了透彻的剖析，目标是能够解答LSTM和BiLSTM的任何疑问。

RNN：循环神经网络
LSTM：长短期记忆网络
BiLSTM：双向长短期记忆网络

重要的先验知识：

本质上单个RNN cell是在多个时间步上展开的形式，也可以理解为 RNN是神经网络在时序上的权重共享（CNN相当于空间上的权重共享），LSTM也都是一样。

1.1 RNN回忆与概览

RNN的不足：它的记忆是短期的。

原因：在反向传播过程中，RNN中存在梯度消失问题（因为RNN在时序上共享参数，梯度在反向传播过程中，不断连乘，数值不是越来越大就是越来越小）。梯度是用于更新神经网络权重的值，梯度消失问题是指随着时间推移，梯度在传播时会下降，如果梯度值变得非常小，则不会继续学习。因此，在RNN中，梯度小幅更新的网络层会停止学习，这些通常是较早的层。由于这些层不学习，RNN无法记住它在较长序列中学习到的内容，因此 *它的记忆是短期的。

1.2 LSTM回忆与概览

LSTM内部结构相对RNN做了改进，BiLSTM中Bi指的是Bi-directional（双向的）的缩写，是由前向LSTM与后向LSTM组合而成，LSTM和BiLSTM如下图所示：

LSTM优点：

LSTM是克服短期记忆问题提出的解决方案，它引入称作 “门”的内部机制，可以调节信息流。
这些门结构可以学习序列中 哪些数据是要保留的重要信息，哪些是要删除的。通过这样做，它可以沿着长链序列传递相关信息来执行预测。

1.3 循环神经网络的几种输入输出结构

从RNN或LSTM结构可以看出，它们的输入输出其实很灵活，不同应用场景可以选择不同输入输出方式，例如下：

单输入-多输出：（仅在第一个时间步输入）

单输入-多输出：（在多个时间步输入）

多输入-多输出：

多输入-单输出：

2 图解 LSTM 内部结构和数据流

2.1 简洁的结构图

2.2 LSTM的原理剖析图

3.1 看2层的 LSTM 是如何运转的

3.2 看1层的 BiLSTM 是如何运转的

用一个文本情感分析的例子来说明：

如下图，单层的BiLSTM其实就是2个LSTM，一个正向去处理序列，一个反向去处理序列，处理完后， 两个LSTM的输出会拼接起来。
特别注意：在这个案例中，所有时间步计算完后，才算是下面这个BiLSTM的结果，如下图，正向LSTM经过6个时间步得到一个结果向量，反向LSTM同样经过6个时间步后，得到另一个结果，然后这两个结果向量拼接起来，作为BiLSTM的最终输出。
疑问：是不是NLP里面大多时候只需要最后一个时刻的输出即可？
答案：这属于N VS 1结构，即N次输入，1次输出。这种结构通常用来处理序列分类问题。如输入一段文字判别它所属的类别，输入一个句子判断其情感倾向，输入一段视频并判断它的类别等等。

3.3 看2层的 BiLSTM 是如何运转的

用OCR识别算法CRNN来说明，以下是CRNN算法的数据处理流程图：

更详细的说，在CRNN算法中，输入BiLSTM的特征序列，它的维度是(26, 512)，长下图这样：

因为CRNN算法中，图像输入是固定为32（高） x 100（宽）的长条图，经过特征提取器后，高会下采样32倍，宽度方向下采样4倍（由于补边操作，导致w最终=(100/4+1)=26），所以，相当于32 x 100的图像信息，被裁剪成26份，每一份的信息用512个值表示，如下：

重要解释归纳如下：

关于时间步：26个切片，也即26个序列，也就是26个时间步，即双层的BiLSTM（也就是4个LSTM，每层一个前向LSTM和一个反向LSTM）会自循环计算26次，从物理意义上说，相当于LSTM按顺序（从左往右同时从右往左）遍历计算了上图26个切片信息。
关于输入列向量Xt：每个序列由512个元素的向量组成，每个时间步，BiLSTM就是去取这512个元素的向量值丢到LSTM单元中去计算。形象的说，就是3.1节中，input_size也即Xt，变为512维向量。
关于输出的拼接：BiLSTM每个时间步其实是由2个相反方向的LSTM在计算结果，它们2个的结果会拼接起来，所以，BiLSTM的输出维度是2 x hidden_size
关于全连接层：CRNN算法中，在上下两层BiLSTM中间，穿插了一个全连接层，来过度上下两层BiLSTM的输入输出关系。至于为什么要加全连接层，我目前也不是特别清楚，估计是把向量长度拉回原来长度。理论上，不加全连接层，两层BiLSTM也完全是可以轻松的衔接起来的。

CRNN算法中，双层BiLSTM代码实现如下：

Original: https://blog.csdn.net/weixin_42118657/article/details/120022112
Author: ⊙月
Title: 一幅图真正理解LSTM、BiLSTM

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548806/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

lightGBM中的lightgbm.train

文章目录 1. lightgbm.train 2.返回 lightgbm.Booster * methods 代码 lightgbm.train lightgbm.train(pa…

人工智能 2023年6月16日
0081
深度学习面试题汇总大全（转）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月24日
0053
【魔改YOLOv5-6.x（4）】结合EIoU、Alpha-IoU损失函数

文章目录 * – 前言 – EIoU – + 论文简介 + 加入YOLOv5 – Alpha-IoU – + 论文简介 …

人工智能 2023年7月26日
0075
linux 环境下安装python3.7

虽然Linux系统默认自带python环境但是比较老了，今天有需要刚好重新配置一下，其他版本同理！不局限于python3.7.0 终端下到python官网找到下载路径, 用wget…

人工智能 2023年6月4日
0059
搭建python3.8虚拟环境+CUDA 11.2+cudnn 8.1.1安装

搭建python虚拟环境+CUDA+cudnn安装 1. 利用conda搭建python3.8环境 * 搭建结束出现： 2. 激活虚拟环境 3. 安装需要的包 4. CUDA安装 …

人工智能 2023年5月25日
00119
MAC M1：解决在jupyter中引入tensorflow内核似乎挂掉的问题

背景：在使用jupyter进行tensorflow学习的过程中，遇到import tensorflow就出现内核似乎挂掉的提示，查阅与实践了好几种解决方法依然没能解决，最终结合a…

人工智能 2023年5月23日
0086
联邦学习入门笔记（四）— 基于差分隐私的FL(ii)

本文详细介绍了DP(差分隐私)+FL(联邦学习)的实现方法，笔者经过一年多的学习，基本上摸清了这个领域的一些套路，这里做一个总结。距离上次发表联邦学习相关的文章已经是一年多前了，…

人工智能 2023年6月15日
0073
基于极限学习机的预测、图像降噪和回归

关于极限学习机，原理较为简单，但也饱受争议。这篇文章只列举几个应用，关于极限学习机的相关文章，请参考如下链接： Extreme learning machine (ELM) 到底怎…

人工智能 2023年6月18日
0093
【pandas数据查询df.loc方法看视频笔记】

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 提示：这&#x91…

人工智能 2023年7月6日
00101
pandas groupby成列表、分层索引MultiIndex；python sort、sorted技巧篇

参考：https://www.it1352.com/1722954.html df = pd.DataFrame( {‘a’:[‘A’,’A’,’B’,’B’,’B’,’C’], …

人工智能 2023年7月7日
0061
地平线X3pi基于YOLOv5-5.0版本程序上板运行推理

地平线X3pi 基于YOLOv5-5.0版本进行模型转换 注意：首先&…

人工智能 2023年7月23日
0099
Window7安装Cuda实践

最近在研究目标检测算法，整了个猫狗分类的数据集，一共2.4万张图片，结果CPU版本的PyTorch根本跑不动，所以下定决心安装个Cuda，把显卡的性能发挥起来。第一步：查看显卡的…

人工智能 2023年7月23日
0062
python调用讯飞语音合成API接口实现文字转语音，然后转换音频格式

首先，注册iFLYTEK账户，并建立实名制。 [En] First, register an iFLYTEK account and set up a real name syst…

人工智能 2023年5月27日
00102
MMdet的Resnet卷积替换成Ghost卷积组所出现的问题

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月9日
0071
记录历经三天将自己的yolov5模型部署到Android安卓手机

将yolov5部署到安卓手机移动端记录历经三天小白将自己的yolov5模型部署到安卓手机一、前言二、具体流程 * （一）.部署官方yolo到安卓 – 1.CMak…

人工智能 2023年7月4日
0079
使用ROS调用YOLO_V5（非darknet）,利用ros-yolov5配置

参考：源码安装YOLO_V5环境以及测试——NVIDIA Jetson Xavier AGX平台 0.ros-yolo5介绍实现yolo作为service的server,发送se…

人工智能 2023年6月24日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

一幅图真正理解LSTM、BiLSTM

1.1 RNN回忆与概览

1.2 LSTM回忆与概览

1.3 循环神经网络的几种输入输出结构

2.1 简洁的结构图

2.2 LSTM的原理剖析图

3.1 看2层的 LSTM 是如何运转的

3.2 看1层的 BiLSTM 是如何运转的

3.3 看2层的 BiLSTM 是如何运转的

大家都在看