PSO粒子群优化-LSTM-优化神经网络神经元个数dropout和batch_size

2023年7月12日下午5:18 • 人工智能 • 阅读 74

1、摘要

本文主要讲解：PSO粒子群优化-LSTM-优化神经网络神经元个数dropout和batch_size，目标为对沪深300价格进行预测
主要思路：

PSO Parameters ：粒子数量、搜索维度、所有粒子的位置和速度、个体经历的最佳位置和全局最佳位置、每个个体的历史最佳适应值
LSTM Parameters 神经网络第一层神经元个数、神经网络第二层神经元个数、dropout比率、batch_size
开始搜索：初始粒子适应度计算、计算初始全局最优、计算适应值、初始全局最优参数、适应度函数、更新个体最优、更新全局最优、全局最优参数
训练模型，使用PSO找到的最好的全局最优参数
plt.show()

2、数据介绍

[‘SP’, ‘High’, ‘Low’, ‘KP’, ‘QSP’, ‘ZDE’, ‘ZDF’, ‘CJL’]

PSO粒子群优化-LSTM-优化神经网络神经元个数dropout和batch_size

需要数据的话去我其他文章找到我的联系方式，有偿
数据链接

; 3、相关技术

PSO好的地方就是论文多，好写引用文献
不过说实话，算法优化我并不推荐用PSO，虽然说PSO的论文多，但是都被用烂了，AutoML-NNI，hyperopt，optuna，ray都是很好很先进的优化框架，里面集成了很多效果非常好的优化算法，推荐大家学习。

4、完整代码和步骤

代码输出如下：

主运行程序入口

import random
import time

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from keras.models import Sequential
from sklearn.metrics import r2_score
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from tensorflow.python.keras.models import Sequential

batch_size = 128
epochs = 2
steps = 10

def process_data():
    dataset = pd.read_csv("D:\项目\量化交易\沪深300/hs300.csv", engine='python', parse_dates=['date'], index_col=['date'])
    columns = ['SP', 'High', 'Low', 'KP', 'QSP', 'ZDE', 'ZDF', 'CJL']

    for col in columns:
        scaler = MinMaxScaler()
        dataset[col] = scaler.fit_transform(dataset[col].values.reshape(-1, 1))
    X = dataset.drop(columns=['SP'], axis=1)
    y = dataset['SP']
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.24, shuffle=False, random_state=666)

    return X_train, y_train, X_test, y_test

def create_dataset(X, y, seq_len=10):
    features = []
    targets = []

    for i in range(0, len(X) - seq_len, 1):
        data = X.iloc[i:i + seq_len]
        label = y.iloc[i + seq_len]

        features.append(data)
        targets.append(label)

    return np.array(features), np.array(targets)

X_train, y_train, X_test, y_test = process_data()
train_dataset, train_labels = create_dataset(X_train, y_train, seq_len=10)
X_test, y_test = create_dataset(X_test, y_test, seq_len=10)

from tensorflow.keras import Sequential, layers

def build_model(neurons, dropout):
    model = Sequential([
        layers.LSTM(units=neurons, input_shape=train_dataset.shape[-2:], return_sequences=True),

        layers.Dropout(dropout),
        layers.LSTM(units=256, return_sequences=True),
        layers.Dropout(dropout),
        layers.LSTM(units=128, return_sequences=True),
        layers.LSTM(units=32),
        layers.Dense(1)
    ])
    return model

def training(X):
    neurons = int(X[0])
    dropout = round(X[1], 6)
    batch_size = int(X[2])
    model = build_model(neurons, dropout)
    model.compile(optimizer='adam',
                  loss='mse')
    model.fit(
        train_dataset,
        train_labels,
        batch_size=batch_size,
        epochs=1,
        validation_data=(X_test, y_test),
        verbose=1)
    model.save(
        'neurons' + str(int(X[0])) + '_dropout' + str(dropout) + '_batch_size' + str(batch_size) + '.h5')

    pred = model.predict(X_test)
    le = len(pred)
    y_t = y_test.reshape(-1, 1)
    return pred, le, y_t

def function(ps, test, le):
    ss = sum(((abs(test - ps)) / test) / le)
    return ss

MAX_EPISODES = 2
MAX_EP_STEPS = 2
c1 = 1
c2 = 1
w = 0.5
pN = 1

dim = 3
X = np.zeros((pN, dim))
V = np.zeros((pN, dim))
pbest = np.zeros((pN, dim))
gbest = np.zeros(dim)
p_fit = np.zeros(pN)
print(p_fit.shape)
print(p_fit.shape)
t1 = time.time()

'''
神经网络第一层神经元个数： 256-259
dropout比率： 0.03-0.19
batch_size： 64-128
'''
UP = [259, 0.19, 128]
DOWN = [256, 0.03, 64]

for i_episode in range(MAX_EPISODES):
    """初始化s"""
    random.seed(8)
    fit = -1e5

    print("计算初始全局最优")
    for i in range(pN):
        for j in range(dim):
            V[i][j] = random.uniform(0, 1)
            if j == 1:
                X[i][j] = random.uniform(DOWN[j], UP[j])
            else:
                X[i][j] = round(random.randint(DOWN[j], UP[j]), 0)
        pbest[i] = X[i]
        le, pred, y_t = training(X[i])
        NN = 1
        tmp = function(pred, y_t, le)
        p_fit[i] = tmp
        if tmp > fit:
            fit = tmp
            gbest = X[i]
    print("初始全局最优参数：{:}".format(gbest))

    fitness = []
    for j in range(MAX_EP_STEPS):
        fit2 = []
        plt.title("第{}次迭代".format(i_episode))
        for i in range(pN):
            le, pred, y_t = training(X[i])
            temp = function(pred, y_t, le)
            fit2.append(temp / 1000)
            if temp > p_fit[i]:
                p_fit[i] = temp
                pbest[i] = X[i]
                if p_fit[i] > fit:
                    gbest = X[i]
                    fit = p_fit[i]
        print("搜索步数：{:}".format(j))
        print("个体最优参数：{:}".format(pbest))
        print("全局最优参数：{:}".format(gbest))

        for i in range(pN):
            V[i] = w * V[i] + c1 * random.uniform(0, 1) * (pbest[i] - X[i]) + c2 * random.uniform(0, 1) * (gbest - X[i])
            ww = 1
            for k in range(dim):
                if DOWN[k] < X[i][k] + V[i][k] < UP[k]:
                    continue
                else:
                    ww = 0
            X[i] = X[i] + V[i] * ww
        fitness.append(fit)

print('Running time: ', time.time() - t1)

neurons = int(gbest[0])
dropout = gbest[1]
batch_size = int(gbest[2])
model = build_model(neurons, dropout)
model.compile(optimizer='adam',
              loss='mse')
model.summary()
history = model.fit(train_dataset, train_labels, epochs=epochs, batch_size=batch_size, verbose=2)

test_preds = model.predict(X_test)
test_preds = test_preds[:, 0]

score = r2_score(y_test, test_preds)
print("r^2 值为： ", score)

plt.figure(figsize=(16,8))
plt.plot(y_test[:1149], label="True value")
plt.plot(test_preds[:1149], label="Pred value")
plt.legend(loc='best')
plt.show()

plt.figure(figsize=(16,8))
plt.plot(history.history['loss'], label='train loss')
plt.legend(loc='best')
plt.show()

from sklearn import metrics

print(metrics.mean_squared_error(y_test,test_preds))

print(np.sqrt(metrics.mean_squared_error(y_test,test_preds)))

print(metrics.mean_absolute_error(y_test,test_preds))

代码比较复杂，如需帮忙请私聊
完整代码和数据链接

5、学习链接

PSO粒子群优化-LSTM-pyswarms框架-实现期货价格预测

https://pypi.org/project/pyswarms/
ljvmiranda921/pyswarms
PySwarms(Python粒子群优化工具包)的使用:GlobalBestPSO例子解析

Original: https://blog.csdn.net/qq_30803353/article/details/122462049
Author: AI信仰者
Title: PSO粒子群优化-LSTM-优化神经网络神经元个数dropout和batch_size

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688050/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

TransE，知识图谱嵌入（KGE）源码阅读（一）

TransE，知识图谱嵌入（KGE）源码阅读（一） Paper： Antoine Bordes等人在2013年发表于NIPS上的文章 Paper Understanding： Tr…

人工智能 2023年6月1日
00112
SSM整合

回答1： SSM指的是 MVC+ 这一组合，而 Security是框架中用于安全认证和授权的模块。将 Security，可以在SSM应用中提供更加完善的安全控制和认证功能。具体…

人工智能 2023年6月29日
0080
数据分析问题（异常值识别）中数据预处理部分流程（含2022年全国服务外包大赛实例）

博主个人理解的数据预处理主要包括个方面：读取文件 => 数据概览 => 缺失值填补 => 数据分布预览 => 衍生特征设计。这套流程在完成异常值识别时作…

人工智能 2023年7月18日
0072
[数据分析]dataframe常用语法

1、导入xlsx、csv文件： df = pd.read_excel(file_path) df=pd.read_csv() 2、pycharm常常不显示完整的dataframe，…

人工智能 2023年7月7日
0075
pytorch：.cuda()&.cpu()&.data&.numpy()

pytorch：.cuda() & .cpu() & .data & .numpy() a.cuda().data.cpu().numpy() a.cuda…

人工智能 2023年7月24日
0062
Pytorch Unet 复现

pytorch-unet 来源：https://github.com/milesial/Pytorch-UNet 前两天搞了一下图像分割，用了下unet。之前没怎么用过。复现了一下…

人工智能 2023年7月22日
0059
CUDA（10.2）＋PyTorch安装加配置详细完整教程

以下均为博主亲测的可靠流程，其中有一些我遇到的问题及解决方法，希望能帮到大家，不再踩坑，也欢迎大家交流遇到的问题和配置方法。 CUDA（10.2）＋PyTorch安装加配置详细完…

人工智能 2023年7月5日
0070
3.2 Python图像的频域图像增强-高通和低通滤波器

3.2 Python图像的频域图像增强-高通和低通滤波器文章目录 3.2 Python图像的频域图像增强-高通和低通滤波器 * 1 算法原理 – + 1.1理想滤波器…

人工智能 2023年6月19日
0069
NLP之Transformer：Transformer结构的详细简介(纯用attention搭建的模型→计算速度更快)之详细攻略

NLP之Transformer：Transformer架构详解之Encoder(Positional Encoding/Multi-Head Attention/Position-…

人工智能 2023年5月31日
0068
C/C++编程工具及实用小软件推荐

目录 1、概述 2、IDE开发工具介绍 2.1、Visual Studio 2.2、QT Creator 3、代码查看与编辑工具 3.1、Visual Studio Code 3….

人工智能 2023年5月30日
0079
免费开源的图像处理软件GIMP下载安装（Windows)

GIMP是GNU Image Manipulation Program（GNU图像处理程序）的缩写，它是Peter Mattis和Spencer Kimhall开发的免费照片和图像…

人工智能 2023年6月20日
0079
目标检测 YOLOv5 – 损失函数的改进

flyfish 完整代码下载地址该改进源码完全兼容原版的YOLOv5:v5版本，同时backbone支持mobilenetv3,shufflenetv2，原有的backbone全部…

人工智能 2023年6月17日
0088
PID增量式算法

PID基础理解：文章目录 PID基础理解： * 1.首先简单的介绍下PID 2.PID的算法实现 1.首先简单的介绍下PID 这里先提供博主的学习资源：PID算法从理论到实践…

人工智能 2023年6月15日
0077
中文短文本关键词抽取方案

目录 * – 1. 前言 – 2. 数据 – 3. 方案 – + 3.1 SIFRank + 3.2 NegSamplingNER …

人工智能 2023年5月28日
00106
【YOLOv5实战3】基于YOLOv5的交通标志识别系统-模型训练

实战博客指引：实战环境搭建自定义数据集模型训练模型测试与评估 YOLOv5整合PyQt5 项目源代码可联系博主获取。一、参数说明再经历前两个步骤后，开始进行模型训练与测…

人工智能 2023年7月9日
00129
GYM雅达利打砖块环境安装

GYM雅达利打砖块环境安装前情提要 * 卸载之前安装的GYM 下载 VS build tools 运行 VS build tools并安装以下工具重启电脑安装cmake, a…

人工智能 2023年7月23日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31