LSTM结合一维CNN使用的基本理解

2023年5月28日上午8:10 • 人工智能 • 阅读 66

结合一维 CNN 和 RNN 来处理长序列已经十分常见，然而这对组合对身为小白的我造成了一定的困扰。要知道CNN各通道的输出可是平行的，并不存在什么先后顺序，然而RNN却要求的输入却是序列，这一开始令我十分不解，而后通过对CNN和RNN的输出输入参数的数量和形状为切入点总算是让我搞明白了它们的运作机理。

简化模型如下：

from keras.models import Sequential
from keras import layers

model = Sequential()
model.add(layers.Conv1D(64, 5, activation='relu',
                        input_shape=(None, 10)))
model.add(layers.LSTM(32))

看看模型的参数数量：

model.summary()
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
conv1d_1 (Conv1D)            (None, None, 64)          3264
_________________________________________________________________
lstm_1 (LSTM)                (None, 32)                12416
=================================================================
Total params: 15,680
Trainable params: 15,680
Non-trainable params: 0
_________________________________________________________________

可以看到卷积层的参数数量是3264个，计算公式为：

(过滤器的长度 * 输入的深度 + 1） * 卷积层通道数

也就是（5 x 10 + 1）x 64 = 3264

LSTM层的参数数量是12416个，计算公式为：

4 x (64 x 32 + 32 x 32 + 32) = 12416

接下来大概介绍一下这两个参数数量代表什么含义(有错漏还请指正)：

一维卷积层接受形状为 [samples, time_steps, depth]的输入，以输入一句由n个单词组成，其中每个单词用长度为10的密集向量表示的句子为例，则该输入的samples=1，time_steps=n, depth=10，形状为[1, n, 10]。

假定该卷积层有64个长度为5的filter，由于 filter的depth必须与input的depth等同，故weight参数数量为 5x10x64，bias的数量为 1×64 。

filter在time_steps轴上进行卷积操作，操作过程与二维卷积思路一致，当 padding=’same’的时候，卷积后每个channel应当得到 长度仍为time_steps，深度为depth的二维张量，但由于要 在depth轴上求和，所以 每个channel给出长度为time_steps的一维张量，整个层 最终给出形状为[samples, time_steps, channels]的输出，例子中为[1, n, 64], 该输出可直接传入LSTM层。 其作用是将原本每个单词的特征(可以由Embeding给出)转化为cnn给出的特征，相当进行了一次抽象程度更高的embedding。另外，只需对卷积层的输出进行pooling操作就可以减小time_steps的长度(一般说来不对channels进行pooling，与二维卷积同样一致)，毕竟过长的序列很容易导致训练过程中出各种幺蛾子。

接下来LSTM层的参数数量就很好理解了，由于LSTM层得到的输入形状为 [samples, time_steps, channels]，由于LSTM自身有32个输出通道，那么根据LSTM的基本架构：

output_t = activation(dot(state_t, Uo) + dot(input_t, Wo) + bo) * c_t

Uo是一个形状为[32, 32]的矩阵，Wo是一个形状为[channels, 32]的矩阵，bo形状为[, 32]，参数数量和为32 x 32 + 64 x 32 + 1 x 32 = 3104。又由于输入门，遗忘门和输出门三个变换的形式都和基本RNN 单元相同，参数数量也相同，所以整个LSTM层的总参数数量为4 x 3104 = 12416

Original: https://blog.csdn.net/a871891824/article/details/120599129
Author: 知者不知，行者未行
Title: LSTM结合一维CNN使用的基本理解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530506/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python-pandas】筛选数据集中指定某些列&行都为(不)空的行列

背景：最近在实战中遇到需要对大数据集的一些空值数据做处理，分类处理一些指定列名的列值都为空的数据行，并分别对拆分的两组数据的完整数据（其实就是利用其他列）进行数据计算处理。下面抽象…

人工智能 2023年7月7日
00102
Pandas两重山之Series（循环）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月17日
0079
【TDA4】源码更新编译和运行(Linux+RTOS mode)

目录说明一、下载源码二、准备文件三、设置环境（首次编译需要）四、编译PSDK Linux 五、编译PSDK RTOS 六、运行测试关于 RTOS SDK 说明硬件平台…

人工智能 2023年6月2日
0087
信息提取

指代消解指代消解技术主要用于解决多个指称对应同一实体对象的问题。在一次会话中，多个指称可能指向的是同一实体对象。利用共指消解技术，可以将这些指称项关联（合并）到正确的实体对象，共…

人工智能 2023年6月1日
0076
anaconda安装教程-手把手教你安装

文章目录 anaconda安装教程 * 一、anaconda安装包的下载二、anaconda安装过程三、验证anaconda安装是否成功 anaconda安装教程 ; 一、an…

人工智能 2023年6月22日
0070
基于Debian搭建Hyperledger Fabric 2.4开发环境及运行简单案例

前言在基于truffle框架实现以太坊公开拍卖智能合约中我们已经实现了以太坊智能合约的编写及部署，但其工作方式注定其只能应用于有限的业务场景中。相比之下，基于超级账本的 Fabr…

人工智能 2023年6月4日
00105
Pandas查询数据的几种方式

一、Pandas查询数据的几种方法 1.df.loc方法，根据行、列的标签值查询 2.df.iloc方法，根据行、列的数字位置查询 3.df.where方法， 4.df.query…

人工智能 2023年7月7日
00124
【python数据分析】数据如何进行合并

数据的合并在拥有了数据基本筛选能力后，我们还要有更加nb的操作，接下来就学习如何利用Pandas合并多个DataFrame数据，以及筛选我们心仪的数据。在数据合并里面主要讲两个函…

人工智能 2023年7月15日
0057
opencv canny边缘检测算法详解

一、边缘检测原理图像的边缘由图像中两个相邻的区域之间的像素集合组成，是指图像中一个区域的结束和另外一个区域的开始。也可以这么理解，图像边缘就是图像中灰度值发生空间突变的像素的集合…

人工智能 2023年7月19日
0061
Pandas 筛选数据的 8 个神操作

日常用 Python做数据分析最常用到的就是查询筛选了，按各种条件、各种维度以及组合挑出我们想要的数据，以方便我们分析挖掘。今天我给大家总结了日常查询和筛选常用的种骚操作，供各位…

人工智能 2023年7月5日
0068
基于树莓派和opencv实现人脸识别

基于树莓派和opencv实现人脸识别源码我放在github上了https://github.com/FjnuThomas/-opencv-各位哥哥姐姐clone代码别忘了给个小心…

人工智能 2023年7月19日
0088
Meetup回顾｜星策社区FeatureStore Meetup V2

继2021年12月11日举办第一次Feature Store Meetup之后，星策开源社区于2022年4月10日举办了第二期「FeatureStore Meetup V2 」，本…

人工智能 2023年5月28日
0086
Tensorflow的安装

Tensorflow用于搭建神经网络。目录参考链接查看显卡版本信息开始安装 * 创建新环境安装cudatoolkit 安装cuDNN 安装tensorflow 测试参考…

人工智能 2023年6月16日
00109
java计算机毕业设计人才库构建研究源码+数据库+lw文档+系统

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0080
数据项目总结 – 租房数据分析（完整篇）

Datawhale干货作者：皮钱超，厦门大学，Datawhale成员深圳租房数据分析完整篇从2020年11月发表第一篇深圳租房数据分析的文章，到这篇基于深度学习框架Keras…

人工智能 2023年6月25日
0065
贝叶斯回归：使用 PyMC3 实现贝叶斯回归

PyMC3(现在简称为PyMC)是一个贝叶斯建模包，它使数据科学家能够轻松地进行贝叶斯推断。 PyMC3采用马尔可夫链蒙特卡罗(MCMC)方法计算后验分布。这个方法相当复杂，原理方…

人工智能 2023年6月17日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

LSTM结合一维CNN使用的基本理解

大家都在看