lstm实例：构建lstm模型过程

2023年6月16日下午4:29 • 人工智能 • 阅读 89

参考连接：

1.定义网络

我们将构建一个LSTM神经网络，在可见层中具有1个输入时间步长和1个输入特征，在LSTM隐藏层中具有10个存储器单元，在完全连接的输出层中具有1个具有线性（默认）激活功能的神经元。
2.编译网络

我们将使用具有默认配置和均方误差丢失函数的高效ADAM优化算法，因为它是回归问题。
3.适合网络

我们将使网络适合1,000个时期，并使用等于训练集中模式数量的批量大小。我们还将关闭所有详细输出。
4.评估网络

我们将在训练数据集上评估网络。通常，我们会在测试或验证集上评估模型。
5.做出预测

我们将对训练输入数据进行预测。同样，通常我们会对我们不知道正确答案的数据做出预测。

步骤1.定义网络
第一步是定义您的网络。

神经网络在Keras中被定义为层序列。这些图层的容器是Sequential类。

第一步是创建Sequential类的实例。然后，您可以创建图层并按照它们应连接的顺序添加它们。由存储器单元组成的LSTM循环层称为LSTM（）。通常跟随LSTM层并用于输出预测的完全连接层称为Dense（）。

例如，我们可以分两步完成：

model = Sequential()
model.add(LSTM(2))
model.add(Dense(1))
但是我们也可以通过创建一个图层数组并将其传递给Sequential的构造函数来一步完成。

layers = [LSTM(2), Dense(1)]
model = Sequential(layers)
网络中的第一层必须定义预期的输入数量。输入必须是三维的，包括样本，时间步和特征。

样品。这些是数据中的行。
时间步。这些是过去对特征的观察，例如滞后变量。
特色。这些是数据中的列。
假设您的数据作为NumPy数组加载，您可以使用NumPy中的reshape（）函数将2D数据集转换为3D数据集。如果您希望列成为一个功能的时间步长，您可以使用：

data = data.reshape((data.shape[0], 1, data.shape[1]))
如果您希望2D数据中的列成为具有一个时间步长的要素，则可以使用：

data = data.reshape((data.shape[0], 1, data.shape[1]))
您可以指定input_shape参数，该参数需要包含时间步数和要素数的元组。例如，如果我们有两个时间步长和一个特征用于单变量时间序列，每行有两个滞后观察值，则将指定如下：

model = Sequential()
model.add(LSTM(5, input_shape=(2,1)))
model.add(Dense(1))
可以通过将LSTM图层添加到Sequential模型来堆叠LSTM图层。重要的是，当堆叠LSTM层时，我们必须为每个输入输出序列而不是单个值，以便后续LSTM层可以具有所需的3D输入。我们可以通过将return_sequences参数设置为True来完成此操作。例如：

model = Sequential()
model.add(LSTM(5, input_shape=(2,1), return_sequences=True))
model.add(LSTM(5))
model.add(Dense(1))
将Sequential模型视为一个管道，其中您的原始数据最终被输入，而预测则来自另一个。

这在Keras中是一个有用的容器，因为传统上与图层相关的关注点也可以拆分并作为单独的图层添加，清楚地显示它们在从输入到预测的数据转换中的作用。将Sequential模型视为一个管道，其中您的原始数据最终被输入，而预测则来自另一个。

例如，可以提取转换来自层中每个神经元的求和信号的激活函数，并将其作为称为激活的层状对象添加到Sequential中。

model = Sequential()
model.add(LSTM(5, input_shape=(2,1)))
model.add(Dense(1))
model.add(Activation(‘sigmoid’))
激活函数的选择对于输出层是最重要的，因为它将定义预测将采用的格式。

例如，下面是一些常见的预测建模问题类型以及可以在输出层中使用的结构和标准激活函数：激活函数的选择对于输出层是最重要的，因为它将定义预测将采用的格式。

回归：线性激活函数，或”线性”，以及与输出数量匹配的神经元数量。
二进制分类（2类）：逻辑激活函数，或’sigmoid’，以及输出层的一个神经元。
多类分类（> 2类）：假设单热编码输出模式，Softmax激活函数或’softmax’，每个类值一个输出神经元。
第2步。编译网络
一旦我们定义了网络，我们就必须编译它。

编译是一个效率步骤。它将我们定义的简单图层序列转换为高效的矩阵变换系列，其格式应在GPU或CPU上执行，具体取决于Keras的配置方式。

将编译视为网络的预计算步骤。定义模型后始终需要它。

编译需要指定许多参数，专门用于培训您的网络。具体地，用于训练网络的优化算法和用于评估由优化算法最小化的网络的损失函数。

例如，下面是编译定义模型并指定随机梯度下降（sgd）优化算法和均值误差（mean_squared_error）损失函数的情况，用于回归类型问题。

model.compile(optimizer=’sgd’, loss=’mean_squared_error’)
或者，可以在作为编译步骤的参数提供之前创建和配置优化程序。

algorithm = SGD(lr=0.1, momentum=0.3)
model.compile(optimizer=algorithm, loss=’mean_squared_error’)
预测建模问题的类型对可以使用的损失函数的类型施加约束。

例如，下面是不同预测模型类型的一些标准损失函数：预测建模问题的类型对可以使用的损失函数的类型施加约束。

回归：均值平方误差或’mean_squared_error’。
二进制分类（2类）：对数损失，也称为交叉熵或”binary_crossentropy”。
多类分类（> 2类）：多类对数损失或’categorical_crossentropy’。
最常见的优化算法是随机梯度下降，但Keras还支持一套其他最先进的优化算法，这些算法在很少或没有配置的情况下都能很好地工作。

也许最常用的优化算法因为它们通常具有更好的性能：

随机梯度下降，或’sgd’，需要调整学习速度和动量。
ADAM，或”亚当”，需要调整学习率。
RMSprop或’rmsprop’，需要调整学习速率。
最后，除了损失函数之外，您还可以指定在拟合模型时收集的度量标准。通常，要收集的最有用的附加度量标准是分类问题的准确性。要收集的度量标准由数组中的名称指定。

例如：

model.compile(optimizer=’sgd’, loss=’mean_squared_error’, metrics=[‘accuracy’])
步骤3.fit网络
一旦网络被编译，它就可以适合，这意味着在训练数据集上调整权重。

安装网络需要指定训练数据，包括输入模式矩阵X和匹配输出模式数组y。

使用反向传播算法训练网络，并根据编译模型时指定的优化算法和损失函数进行优化。

反向传播算法要求网络训练指定数量的时期或暴露于训练数据集。

每个纪元可以被划分为称为批次的输入 – 输出模式对的组。这定义了在一个纪元内更新权重之前网络所接触的模式数。它也是一种效率优化，确保一次不会将太多输入模式加载到内存中。

拟合网络的最小例子如下：

history = model.fit(X, y, batch_size=10, epochs=100)
适合后，将返回历史对象，该对象提供训练期间模型性能的摘要。这包括损失和编译模型时指定的任何其他指标，记录每个时期。

训练可能需要很长时间，从几秒到几小时到几天，具体取决于网络的大小和培训数据的大小。适合后，将返回历史对象，该对象提供训练期间模型性能的摘要。这包括损失和编译模型时指定的任何其他指标，记录每个时期。

默认情况下，每个纪元的命令行上都会显示一个进度条。这可能会给您带来太多噪音，或者可能会对您的环境造成问题，例如您使用的是交互式笔记本电脑或IDE。

通过将详细参数设置为2，可以减少每个时期显示的信息量。您可以通过将详细设置为1来关闭所有输出。例如：

history = model.fit(X, y, batch_size=10, epochs=100, verbose=0)
第4步。评估网络
一旦网络被训练，就可以对其进行评估。

可以在训练数据上评估网络，但是这不会提供作为预测模型的网络性能的有用指示，因为它之前已经看到了所有这些数据。

我们可以在测试期间看不到的单独数据集上评估网络的性能。这将在未来对未见数据进行预测时提供网络性能的估计。

该模型评估所有测试模式的损失，以及编译模型时指定的任何其他指标，如分类准确性。返回评估指标列表。

例如，对于使用精度度量编制的模型，我们可以在新数据集上对其进行评估，如下所示：

loss, accuracy = model.evaluate(X, y)

与拟合网络一样，提供详细输出以了解评估模型的进度。我们可以通过将verbose参数设置为0来关闭它。

loss, accuracy = model.evaluate(X, y, verbose=0)

第5步。做出预测
一旦我们对拟合模型的性能感到满意，我们就可以用它来预测新数据。

这就像使用一组新输入模式调用模型上的predict（）函数一样简单。

例如：

predictions = model.predict(X)

预测将以网络输出层提供的格式返回。

在回归问题的情况下，这些预测可以是直接问题的格式，由线性激活函数提供。预测将以网络输出层提供的格式返回。

对于二元分类问题，预测可以是第一类的概率数组，其可以通过舍入转换为1或0。

对于多类分类问题，结果可以是概率数组的形式（假设一个热编码输出变量），可能需要使用argmax（）NumPy函数将其转换为单个类输出预测。

或者，对于分类问题，我们可以使用predict_classes（）函数，该函数会自动将uncrisp预测转换为清晰的整数类值。

predictions = model.predict_classes(X)

与拟合和评估网络一样，提供详细输出以给出预测模型进展的概念。我们可以通过将verbose参数设置为0来关闭它。

predictions = model.predict(X, verbose=0)

Original: https://blog.csdn.net/WangYouJin321/article/details/123251651
Author: 小金子的夏天
Title: lstm实例：构建lstm模型过程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625424/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测的Tricks | 【Trick12】分布式训练（Multi-GPU）与DistributedParallel使用相关总结

如有错误，恳请指出。用这篇博客记录多卡（也就是mutil-gpu）的使用，目的是加快训练过程，在pytorch中称之为分布式训练。在pytorch中主要使用的是Distribut…

人工智能 2023年7月12日
0073
arm64 虚拟地址物理地址转换

linux5.15 armv8-a arm文档 VMSA章节 D5.2.4 Memory translation granule size A VMSA provides a Me…

人工智能 2023年6月28日
0082
数据分析（R语言）——ggplot绘制多线图结果图颜色不匹配

问题描述： MelbCV.csv是墨尔本人行道监控数据的一个子集如下图，依据统计数据回答各个监控点一天的哪些时段是行人通过的高峰？所有监控点是否有一致的人流高峰时段？若有，是哪个（…

人工智能 2023年7月17日
0071
VS的使用插件

1．插件安装： 1） productivity power tools：代码查看优化插件； 2） Visaul Studio Color Theme Editor 主题修改插件；…

人工智能 2023年6月12日
0097
纯文字图片缩小后像素点丢失的一种逃课式解决办法（Android）

前言最近遇到一个需求，是当接收到一个尺寸很大的纯文字图片时，需要在屏幕上缩小若干倍显示出来且不失真。而一般 Android 对图片的处理方法是邻近采样或者双线性采样，下面对…

人工智能 2023年6月20日
0087
【论文导读】-Vertically Federated Graph Neural Network for Privacy-Preserving Node Classification纵向联邦图神经网络

文章目录论文信息摘要主要贡献 vertically federated GNN (VFGNN) 执行过程 * 1. 生成初始节点嵌入 2. 生成局部节点嵌入 3. 生成全局节…

人工智能 2023年7月26日
0066
音频信号处理（一）语音录制

import pyaudio CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 2 RATE = 16000 p = pyaudio…

人工智能 2023年5月27日
0072
opencv 直方图均衡化(-215:Assertion failed) _src.type() == CV_8UC1 in function ‘equalizeHist‘

…… median = cv2.medianBlur(img_dif2, 5)print(type(median),median.shape,median….

人工智能 2023年6月19日
0093
win10系统下安装theano+lasagne

win10系统下安装theano+lasagne 由于最近需要跑一个全景视频显著性检测的网络SalGan360，是用theano搭建的，比较古老的一种框架，很多博客写的都不是很全，…

人工智能 2023年7月14日
00114
Keras实现RNN和LSTM做回归预测（python）

学习了RNN和LSTM的理论知识，下面再来使用Keras实现一下这些模型。理论知识：循环神经网络（RNN） LSTM神经网络和GRU Keras实现神经网络： Keras实现全…

人工智能 2023年6月18日
0065
支持哪些类型

问题描述在进行数据分析和机器学习任务时，我们经常需要将不同类型的数据转换为数字类型，以便进行进一步的处理。然而，并不是所有类型的数据都可以直接转换为数字形式。因此，需要一种方法来…

人工智能 2024年1月3日
0052
用自建kinetics-skeleton行为识别数据集训练st-gcn网络流程记录

用自建kinetics-skeleton行为识别数据集训练st-gcn网络流程记录 * – + * 0. 准备工作 * 1. 下载/裁剪视频 * 2. 利用OpenPo…

人工智能 2023年6月30日
0092
监督学习（回归、分类问题）与无监督学习（聚类问题）

在机器学习中，根据训练的样本是否具备标签Label，或者是否对样本数据进行类别标记，分为方式和方式。简单来说，监督学习方式需要事先准备样本数据，这些样本数据具备标签（Labe…

人工智能 2023年6月2日
00143
Python知识点大全（非常详细）

Python知识点大全 Python知识点汇总（一） Python知识点汇总（二） Python知识点汇总（一） 1、Python的两种编程⽅式：交互式（随输随运⾏）和⽂件式（主要…

人工智能 2023年6月23日
0064
【Tensorflow】Failed to load the native TensorFlow runtime及exit code -1073741819 (0xC0000005)问题解决

解决方案这个问题具体为啥确实不清楚，对底层不太熟悉。大概应该是因为缺少依赖，还有的相似的问题，可能是因为tensorflow和你的cuda版本不匹配。比如我的电脑上cuda就是1…

人工智能 2023年5月23日
0096
超简单教你在树莓派上安装opencv（二）

超简单教你在树莓派上安装opencv（二）前言一、如何基于python3.9.2安装OpenCv？ * 1.1 查看自己系统位数及Python版本，跟对教程 1.2 换源 1….

人工智能 2023年7月20日
0098

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

lstm实例：构建lstm模型过程

大家都在看