pytorch中LSTM参数详解（一张图帮你更好的理解每一个参数）

2023年7月22日上午10:55 • 人工智能 • 阅读 90

对LSTM网络的理解

对LSTM网络不理解的请看这篇博客，对新手比较友好，也很容易理解，只有理解了LSTM，才知道下面要讲的参数分别对应什么

LSTM参数列表

Pytorch中创建一个LSTM网络，参数列表如下：

参数解释input_size输入数据的特征维数hidden_sizeLSTM中隐层的维度num_layers循环神经网络的层数bias用不用偏置，default=Truebatch_first这个要注意，通常我们输入的数据shape=(batch_size,seq_length,embedding_dim),而batch_first默认是False,所以我们的输入数据最好送进LSTM之前将batch_size与seq_length这两个维度调换dropout默认是0，代表不用dropoutbidirectional默认是false，代表不用双向LSTM

其实最重要的参数就前三个，其他参数都可以默认。把网络看成一个黑箱，我们在用是肯定是输入一个向量，然后网络处理后输出一个向量，所以我们必须要告诉网络输入的向量是多少维，输出的为多少维，因此前两个参数就决定了输入和输出向量的维度。当然，hidden_size只是指定从LSTM输出的向量的维度，并不是最后的维度，因为LSTM层之后可能还会接其他层，如全连接层（FC），因此hidden_size对应的维度也就是FC层的输入维度。第三个参数num_layers为隐藏层的层数，这个比较好理解，官方的例程里面建议一般设置为1或者2。

光看上面的文字描述似乎还不够直白，因此我画了一张图。
注：局部图片来自于这篇文章

; Input shape

建好网络之后我们还需要把数据调整整对应的shape，pytorch中LSTM的调用如下：

output,(h_n,c_n) = lstm (x, [ht_1, ct_1])

其中x就是我们喂给网络的数据，它的shape要求如下：

x:[seq_length, batch_size, input_size]

新手可能对着三个参数容易理解错误，这里贴一篇知乎上的文章用「动图」和「举例子」讲讲 RNN，这篇文章讲的比较通俗易懂，适合新手看。
同样，我也画了几张对应的图来解释

转载或拿图请注明出处。

Original: https://blog.csdn.net/baidu_38963740/article/details/117197619
Author: xjtuwfj
Title: pytorch中LSTM参数详解（一张图帮你更好的理解每一个参数）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708888/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

AI模型设计：安装C++版本的libtensorflow(1.10~2.6.0)以及TFC++ demo源码的实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0058
关于pytorch与CUDA版本匹配问题

项目场景：在跑CLAM实验时遇到如下问题：RuntimeError: CUDA error: no kernel image is available for execution…

人工智能 2023年7月20日
0073
使用ResNet-50实现图像分类任务

摘要：承接上一篇LeNet网络模型的图像分类实践，本次我们再来认识一个新的网络模型：ResNet-50。不同网络模型之间的主要区别是神经网络层的深度和层与层之间的连接方式，正文内…

人工智能 2023年6月16日
0092
时间序列平稳性检验（ADF）和白噪声检验（Ljung-Box）

在对时间序列做预测前，我们要对数据进行一系列检验，主要是检验数据的稳定性和随机性（白噪声检验），本文主要介绍 ADF检验和 Ljung-Box检验 ADF检验 ADF检验即单位根检…

人工智能 2023年6月18日
0074
百度语音合成模型Deep Voice3

INTRODUCTION Deep Voice3是由百度提出的一个全新的全卷积TTS架构。百度的主要工作分为如下五个方面：提出了一个全卷积的 character-to-spect…

人工智能 2023年5月27日
00214
门槛回归模型_VAR向量自回归&面板门槛模型

一、VAR向量自回归先做同阶平稳分析，在进行VAR自回归，回归好以后再进行协整检验和单位圆检验，检验好以后用脉冲相应函数和方差分解来研究变量之间的互动关系。首先，导入数据首先…

人工智能 2023年6月18日
00161
详解回归分析（Regression）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月17日
0046
刷完这50个标准库模块：没人比我更懂Python了

python强大，主要是因为包多，且不说第三方包，单是标准库就让人望而生畏了。在整理标准库的过程中，查阅了大量资料，以及官方文档，发现很多中文资料都有一个共同的特点——机翻风格严…

人工智能 2023年7月3日
0074
手撕目标检测之第一篇：目标检测的总体流程

总体流程前言 * 了解 VOC 数据集 – 0、VOC数据集下载 1、VOC 数据集的20个类别及其层级结构： 2、下载文件的架构 3、标签文件Annotations…

人工智能 2023年7月9日
00133
论文笔记：U2Fusion A Unified Unsupervised ImageFusion Network（2020 TPAMI）

U2Fusion: A Unified Unsupervised Image Fusion Network 【引用格式】： Xu H , Ma J , Jiang J , et …

人工智能 2023年6月26日
0072
【2022】保姆级Anaconda安装与换国内源教程

一、Anaconda的安装由于Anaconda官网在境外，为了提升下载速度，我们选择从北京外国语大学镜像站下载Anaconda的安装包。截止到写作时，Anaconda3最新版本…

人工智能 2023年7月25日
0041
吴恩达深度学习笔记——神经网络与深度学习（Neural Networks and Deep Learning）

文章目录前言传送门神经网络与深度学习（Neural Networks and Deep Learning） * 绪论梯度下降法与二分逻辑回归（Gradient Descen…

人工智能 2023年6月15日
0073
知识图谱基本概念

1、知识表示（1）基于向量的知识表示比较热门，将知识图谱三元组中的主谓宾转换成数值，构成向量。通过向量的知识表示，可以采用统计或者神经网络的方法进行推理，对知识图谱中实体直接的关…

人工智能 2023年6月10日
0062
基于朴素贝叶斯的鸢尾花数据集分类

目录 1.作者介绍 2.理论知识介绍 * 2.1算法介绍 2.2数据集介绍 3.实验代码及结果 * 3.1 数据集下载 3.2实验代码 3.2实验结果 1.作者介绍王炜鑫，男，西…

人工智能 2023年7月3日
0063
视觉SLAM面试问题和学习资料整理

文章目录零、参考链接一、视觉SLAM面试相关问题 * 1、李群与李代数的映射关系 2、李群与李代数的扰动模型 3、SIFT与SURF特征的区别 4、相似变换、仿射变换、射影变换…

人工智能 2023年5月26日
00111
Python自动抢购脚本，学废了双十一双十二帮女票抢购心爱的礼物，隔壁女孩都馋哭了。

Python版本：3.10分享一个秒杀抢购的脚本程序，感兴趣的朋友一起看看吧第一步：需要把想要的商品加进购物车 （ 此&#x8…

人工智能 2023年7月3日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pytorch中LSTM参数详解（一张图帮你更好的理解每一个参数）

大家都在看