GRU时间序列数据分类预测

2023年7月25日下午9:48 • 人工智能 • 阅读 115

目的：通过一段时间的数据，预测后面一段时间的类别，比如输入数据是1-50步的变量，预测的是50-60步的类别。

输入变量的数目：15

预测的类别数：0,1,2,3,4,10 （1类数目最多，数据不均衡）

GRU模型参数解释：

参考链接：[Pytorch系列-54]：循环神经网络 – torch.nn.GRU（）参数详解_文火冰糖的硅基工坊的博客-CSDN博客_nn.gru参数

input_size: 输入序列的变量的数目。

hidden_size: 隐藏层的特征的数目。

num_layers: GRU层的数目。

bias：是否需要偏置，默认是True（需要）。

batch_first: 用于确定batch size是否需要放到输入输出数据形状的最前面。

若为True，则输入、输出的tensor的格式为(batch， seq_len， feature)

若为False，则输入、输出的tensor的格式为(seq_len，batch，feature)

默认是False。

为什么需要该参数呢？

在CNN网络和全连接网络，batch通常位于输入数据形状的最前面。

而对于具有时间信息的序列化数据，通常需要把seq放在最前面，需要把序列数据串行地输入网络中。（那我的模型不能设置为True？？？）

seq_len: 输入序列的长度。在我的情形下可以为50。

搭建GRU网络：

参考链接： pytorch使用torch.nn.Sequential快速搭建神经网络 – pytorch中文网

self.gru = nn.GRU(self.input_size, self.hidden_size, self.num_layers, batch_first=True, dropout=self.dropout)
self.fc = nn.Sequential(nn.Linear(self.hidden_size, self.output_size), nn.Sigmoid())

self.gru = torch.nn.GRU(self.input_size, self.hidden_size, self.num_layers, batch_first=True)
self.fc1 = torch.nn.Linear(self.hidden_size, 4)
self.fc2 = torch.nn.Linear(self.hidden_size, 4)
self.fc3 = torch.nn.Linear(self.hidden_size, 4)
self.fc4 = torch.nn.Linear(self.hidden_size, 4)
self.fc5 = torch.nn.Linear(self.hidden_size, 4)
self.softmax = torch.nn.Softmax(dim=1)

nn.Sequential：是一个Sequential容器，模块将按照构造函数中传递的顺序添加到模块中。另外，也可以传入一个有序模块。使用 torch.nn.Sequential会自动加入激励函数。

torch.nn.Sequential与torch.nn.Module区别与选择

使用 torch.nn.Module，我们可以根据自己的需求改变传播过程，如 RNN等
如果你需要快速构建或者不需要过多的过程，直接使用 torch.nn.Sequential即可

nn.Linear(input_dim , output_dim)

torch.nn.Softmax(dim=1)

参考链接: torch.nn.Softmax_CtrlZ1的博客-CSDN博客_torch.nn.softmax

tensor([[0.3458, 0.0596, 0.5147],
[0.3774, 0.7503, 0.3705],
[0.2768, 0.1901, 0.1148]])

dim=0表示对于第一个维度的对应下标之和是1, 即0.3458+0.3774+0.2768=1、0.0596+0.7503+0.1901=1。

tensor([[0.3381, 0.1048, 0.5572],
[0.1766, 0.6315, 0.1919],
[0.3711, 0.4586, 0.1704]])

dim=1表示对于第二维度而言，对应下标之和为1，0.3381+0.1048+0.5572=1, 0.1766+0.6315+0.1919=1，即所有列的对应下标之和为1。

一些报错记录：

1. 计算交叉熵损失使用的output必须是softmax输出的概率而不是argmax之后得到的类别。

RuntimeError: Expected floating point type for target with class probabilities, got Long

语义分割损失函数系列(1):交叉熵损失函数_spectrelwf的博客-CSDN博客_语义分割交叉熵

2. 加载生成训练数据集的时候报错。

Ran out of input

python报错Ran out of input_在上树的路上的博客-CSDN博客

因为生成的数据集太大了，要减少数据集。（The actually error is OverflowError: cannot serialize a bytes object larger than 4 GiB. You have to reduce the size of the input.）

3. 输入张量和隐藏张量不在一个device上。

h_0 = torch.zeros(self.num_layers, batch_size, self.hidden_size)

Input and hidden tensors are not at the same device, found input tensor at cuda:0 and hidden tensor at cpu

h_0 = torch.zeros(self.num_layers, batch_size, self.hidden_size).to(Train.device)

Input and hidden tensors are not at the same device, found input tensor at cpu and
and hidden tensor at cuda:0

解决方法：

output, _ = self.gru(input_seq.to(Train.device), h_0)

（input_seq后面加上to(Train.device)）

4. 预测和真实标签长度不一致。

&#x62A5;&#x9519;&#xFF1A;Found input variables with inconsistent numbers of samples

y_true. shape
y_predict.shape

查看真实值和预测值的形状。

Original: https://blog.csdn.net/weixin_39915444/article/details/127242809
Author: 儒雅的晴天
Title: GRU时间序列数据分类预测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/715827/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ubuntu 20.04 opencv4.5.4安装记录

安装opencv sudo apt-get install cmake 下载Opencv和opencv_contrib并编译opencv下载：https://github.com/…

人工智能 2023年7月20日
0068
python基础知识笔记

参考视频和资料：2022新版黑马程序员python教程，8天python从入门到精通，学python看这套就够了_哔哩哔哩_bilibili 最后有知识的思维导图！ Python入…

人工智能 2023年7月18日
0071
pytorch主要模块

机器学习基本流程如下·：深度学习基本流程如下：基本参数设置 import os import numpy as np import torch import torch.nn …

人工智能 2023年7月24日
0067
Python机器学习09——随机森林

本系列所有的代码和数据都可以从陈强老师的个人主页上下载：Python数据程序参考书目：陈强.机器学习及Python应用. 北京：高等教育出版社, 2021. 本系列基本不讲数学原…

人工智能 2023年6月15日
0077
Pytorchprofilerwithtensorboard.

文章目录前言：你将学到什么？一、准备数据集和模型二、使用profiler来记录执行的事件三、执行profiler 四、使用TensorBoard来观察结果并对模型性能做出分…

人工智能 2023年7月24日
00110
数字图像处理-图像基础-复习总结

文章目录数字图像处理复习总结 * 数字图像基础 – 数字图像基础概念采样和量化非均匀采样与量化数字图像常见失真类型数字图像处理基础 – 数字图像处…

人工智能 2023年6月23日
0092
粒子群优化算法（PSO）

粒子群优化算法（PSO）粒子群优化算法（PSO）是一种进化计算技术，源于对鸟群捕食行为的研究。该算法最初是受到飞鸟集群活动的规律性启发，进而利用群体智能建立的一个简化模型。粒子群…

人工智能 2023年7月3日
0075
makefile 调试

我们常常拿到一个代码，不知道从哪里入手，不清楚每个文件的依赖关系，代码的组织结构，这个时候，就需要从Makefile入手，分析代码的文件结构。可是Makefile有些时候写的很复…

人工智能 2023年6月27日
0077
图像处理与机器学习——图像增强（空间域变换——空间域滤波）

本文内容空域滤波的由来低通滤波器（均值、高斯低通滤波器）（平滑图像）中值滤波器高通滤波器（锐化图像，几个常见算子的由来）空间域滤波原有的灰度级转换函数，例如线性变换函数…

人工智能 2023年6月22日
0074
Python机器学习-多元分类的5种模型

最近上了些机器学习的课程，于是想透过Kaggle资料集来练习整个资料科学专案的流程，在模型训练阶段，虽然听过许多分类模型，但不是很了解其各别的优缺点与适合的使用时机，所以想来整理一…

人工智能 2023年6月15日
0091
Python建立线性回归模型进行房价预测

Python建立线性回归模型进行房价预测前期准备多因子房价预测 * 实战流程 – 1.数据加载 2.数据可视化 3.数据预处理 4.模型建立与训练 5.模型预测 6…

人工智能 2023年7月29日
00102
PyTorch ResNet实现图像分类(从模型的训练到Android部署)

1.数据集数据集地址：https://www.kaggle.com/slothkong/10-monkey-species采用kaggle上的猴子数据集，包含两个文件：训练集和验…

人工智能 2023年7月13日
0073
YOLOV7训练自己的yolo数据集

YOLOv7源码：https://github.com/WongKinYiu/yolov7 文章目录一、配置YOLOv7环境二、使用自己的数据集训练 * 修改yolov7配置 …

人工智能 2023年7月21日
0058
pytorch入门学习第五课图片分类代码实现

import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as opti…

人工智能 2023年7月2日
0052
情感计算——多模态情感识别

一、背景和意义情感是通过多种模态的形式进行表达的情感涉及主观经历、生理反应和行为反应；每个人都有自己的主观感受，身体会出现一系列的生理反应，并且通过表情、言语和肢体动作等行…

人工智能 2023年7月26日
0065
记录-安装cuda与cudnn 及对应版本的tensorflow|pytorch

仅用以记录个人环境配置流程。一、安装CUDA Driver 1.1 查看CUDA Driver版本 1.2 驱动更新下载地址：NVIDIA Studio 驱动程序 | 512.5…

人工智能 2023年7月21日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

GRU时间序列数据分类预测

torch.nn.Sequential与torch.nn.Module区别与选择

大家都在看