PSO粒子群优化CNN-优化神经网络神经元个数dropout和batch_size等超参数

2023年7月13日上午3:15 • 人工智能 • 阅读 106

1、摘要

本文主要讲解：PSO粒子群优化-CNN-优化神经网络神经元个数dropout和batch_size，目标为对沪深300价格进行预测
主要思路：

PSO Parameters ：粒子数量、搜索维度、所有粒子的位置和速度、个体经历的最佳位置和全局最佳位置、每个个体的历史最佳适应值
CNN Parameters 神经网络第一层神经元个数、神经网络第二层神经元个数、dropout比率、batch_size
开始搜索：初始粒子适应度计算、计算初始全局最优、计算适应值、初始全局最优参数、适应度函数、更新个体最优、更新全局最优、全局最优参数
训练模型，使用PSO找到的最好的全局最优参数
plt.show()

2、数据介绍

[‘SP’, ‘High’, ‘Low’, ‘KP’, ‘QSP’, ‘ZDE’, ‘ZDF’, ‘CJL’]

PSO粒子群优化CNN-优化神经网络神经元个数dropout和batch_size等超参数

需要数据的话去我其他文章找到我的球球

; 3、相关技术

PSO好的地方就是论文多，好写引用文献
不过说实话，算法优化我并不推荐用PSO，虽然说PSO的论文多，但是都被用烂了，AutoML-NNI，hyperopt，optuna，ray都是很好很先进的优化框架，里面集成了很多效果非常好的优化算法，推荐大家学习。

4、完整代码和步骤

代码输出如下：

主运行程序入口

import os
import os
import random
import time

import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from keras.callbacks import EarlyStopping
from keras.layers import Dense, Dropout, LSTM
from keras.layers.core import Activation
from keras.models import Sequential
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from tensorflow.keras import Sequential
from tensorflow.python.keras.layers import Conv1D
from tensorflow.python.keras.models import Sequential

import csv
def writeOneCsv(relate_record, src):
    with open(src, 'a', newline='\n') as csvFile:
        writer = csv.writer(csvFile)
        writer.writerow(relate_record)

np.random.seed(666)
matplotlib.rcParams['agg.path.chunksize'] = 0
matplotlib.rcParams.update(matplotlib.rc_params())

src = 'D:\项目\PSO-LSTM模型预测时间序列\数据\\'
src1 = 'D:\项目\PSO-LSTM模型预测时间序列\图片\\'
os.chdir(r'D:\项目\PSO-LSTM模型预测时间序列')
filename = 'lstm4_pso_'

batch_size = 128
epochs = 2
steps = 10
scalerx = StandardScaler()
scalery = StandardScaler()

def process_data():

    dataset = pd.read_csv("data5.csv", engine='python', parse_dates=['date'], usecols=range(1, 9), index_col=['date'])
    columns = ['Y', 'X1', 'X2', 'X3', 'X4', 'X5', 'X6']

    for col in columns[1:]:
        dataset[col] = scalerx.fit_transform(dataset[col].values.reshape(-1, 1))

    for col in columns[:1]:
        dataset[col] = scalery.fit_transform(dataset[col].values.reshape(-1, 1))
    X = dataset.drop(columns=['Y'], axis=1)
    y = dataset['Y']

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False, random_state=666)
    return X_train, y_train, X_test, y_test

def create_dataset(X, y, seq_len):
    features = []
    targets = []

    for i in range(0, len(X) - seq_len, 1):
        data = X.iloc[i:i + seq_len]
        label = y.iloc[i + seq_len]

        features.append(data)
        targets.append(label)
    trainX = np.array(features).astype('float64')
    return trainX, np.array(targets).reshape(-1, 1)

def build_model(neurons1, neurons2, dropout):
    X_train, y_train, X_test, y_test = process_data()
    X_train, y_train = create_dataset(X_train, y_train, steps)
    X_test, y_test = create_dataset(X_test, y_test, steps)
    nb_features = X_train.shape[2]
    input1 = X_train.shape[1]
    model1 = Sequential()
    model1.add(Conv1D(neurons1, kernel_size=4, strides=2, input_shape=(input1, nb_features)))
    model1.add(Dropout(dropout))
    model1.add(Conv1D(neurons2, kernel_size=4, strides=2, input_shape=(input1, nb_features)))
    model1.add(Dropout(dropout))

    model1.add(Dense(units=1))
    model1.add(Activation("linear"))
    model1.compile(loss='mse', optimizer='Adam', metrics='mae')
    return model1, X_train, y_train, X_test, y_test

def training(X):
    neurons1 = int(X[0])
    neurons2 = int(X[1])
    dropout = round(X[2], 6)
    batch_size = int(X[3])
    print(X)
    model, X_train, y_train, X_test, y_test = build_model(neurons1, neurons2, dropout)
    model.fit(
        X_train,
        y_train,
        batch_size=batch_size,
        epochs=22,
        validation_split=0.1,
        verbose=1,
        callbacks=[EarlyStopping(monitor='val_loss', patience=22, restore_best_weights=True)])

    pred = model.predict(X_test)
    le = len(pred)
    y_t = y_test.reshape(-1, 1)
    return pred, le, y_t

def function(ps, test, le):
    ss = sum(((abs(test - ps)) / test) / le)
    return ss

MAX_EPISODES = 22
MAX_EP_STEPS = 22
c1 = 2
c2 = 2
w = 0.5
pN = 100

dim = 4
X = np.zeros((pN, dim) )
V = np.zeros((pN, dim))
pbest = np.zeros((pN, dim))
gbest = np.zeros(dim)
p_fit = np.zeros(pN)
print(p_fit.shape)
print(p_fit.shape)
t1 = time.time()

'''
神经网络第一层神经元个数
神经网络第二层神经元个数
dropout比率
batch_size
'''
UP = [150, 15, 0.5, 16]
DOWN = [50, 5, 0.05, 8]

for i_episode in range(MAX_EPISODES):
    """初始化s"""
    random.seed(8)
    fit = -1e5

    print("计算初始全局最优")
    for i in range(pN):
        for j in range(dim):
            V[i][j] = random.uniform(0, 1)
            if j == 2:
                X[i][j] = random.uniform(DOWN[j], UP[j])
            else:
                X[i][j] = round(random.randint(DOWN[j], UP[j]), 0)
        pbest[i] = X[i]
        le, pred, y_t = training(X[i])
        NN = 1

        tmp = function(pred, y_t, le)
        p_fit[i] = tmp
        if tmp > fit:
            fit = tmp
            gbest = X[i]
    print("初始全局最优参数：{:}".format(gbest))

    fitness = []
    for j in range(MAX_EP_STEPS):
        fit2 = []
        plt.title("第{}次迭代".format(i_episode))
        for i in range(pN):
            le, pred, y_t = training(X[i])
            temp = function(pred, y_t, le)
            fit2.append(temp / 1000)
            if temp > p_fit[i]:
                p_fit[i] = temp
                pbest[i] = X[i]
                if p_fit[i] > fit:
                    gbest = X[i]
                    fit = p_fit[i]
        print("搜索步数：{:}".format(j))
        print("个体最优参数：{:}".format(pbest))
        print("全局最优参数：{:}".format(gbest))
        for i in range(pN):
            V[i] = w * V[i] + c1 * random.uniform(0, 1) * (pbest[i] - X[i]) + c2 * random.uniform(0, 1) * (
                    gbest - X[i])
            ww = 1
            for k in range(dim):
                if DOWN[k] < X[i][k] + V[i][k] < UP[k]:
                    continue
                else:
                    ww = 0
            X[i] = X[i] + V[i] * ww
        fitness.append(fit)

print('Running time: ', time.time() - t1)

neurons1 = int(gbest[0])
neurons2 = int(gbest[1])
dropout = gbest[2]
batch_size = int(gbest[3])
model, X_train, y_train, X_test, y_test = build_model(neurons1, neurons2, dropout)
history1 = model.fit(X_train, y_train, epochs=222, batch_size=batch_size, validation_split=0.2, verbose=1,
                     callbacks=[EarlyStopping(monitor='val_loss', patience=9, restore_best_weights=True)])

y_score = model.predict(X_test)
scaler_y_score = scalery.inverse_transform(y_score)
scaler_y_test = scalery.inverse_transform(y_test)
writeOneCsv(scaler_y_score, src + filename + 'pred_real.csv')
writeOneCsv(scaler_y_test, src + filename + 'pred_real.csv')
plt.figure(figsize=(10, 10))
plt.plot(scaler_y_score)
plt.plot(scaler_y_test)
plt.title('real vs pred test')
plt.ylabel('V')
plt.xlabel('X')
plt.legend(['pred', 'real'], loc='lower right')
plt.savefig(src1 + filename + 'pred_real.png')
plt.show()

代码比较复杂，如需帮忙请私聊

5、学习链接

PSO粒子群优化-LSTM-pyswarms框架-实现期货价格预测
 PSO优化GRU-LSTM超参数
 PSO粒子群优化-LSTM-优化神经网络神经元个数dropout和batch_size

Original: https://blog.csdn.net/qq_30803353/article/details/126433127
Author: AI信仰者
Title: PSO粒子群优化CNN-优化神经网络神经元个数dropout和batch_size等超参数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688959/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

AI遮天传 ML/DL-感知机

感知机的出现是人工智能发展史一大重要里程碑，其后才诞生了：多层感知机、卷积神经网络等一系列的经典网络模型。在我看来，它虽然是深度学习领域的一大开端，但本身解决的只是线性二分类问题…

人工智能 2023年7月28日
0067
[总结] VLAD & NetVLAD & NeXtVLAD

参考：https://www.jianshu.com/p/7d48bff4d1c3 NeXtVLAD 是一个特征聚合的网络，可以在向量空间中提取全局描述子特征，减少参数，提升性…

人工智能 2023年5月31日
0062
Tensorflow下mask rcnn成功运行需要匹配的各个库的版本

Package Version Original: https://blog.csdn.net/qq_44187669/article/details/124276545Autho…

人工智能 2023年5月24日
0076
基于pyskl的poseC3D训练自己的数据集

最近在研究视频动作识别，看了不少的相关算法，主要有基于MMDetection框架下的一些列的研究，有直接对视频进行识别，获取人为动作，比如slowfast等等，但是往往也有一定的局…

人工智能 2023年7月25日
0083
tensorflow GPU安装

安装CUDA 先查看自己NVIDIA对应的cuda版本到官网下载 CUDA下载地址：https://developer.nvidia.com/cuda-toolkit-archi…

人工智能 2023年5月25日
0078
（项目笔记）opencv人脸识别

Haar级联： Haar特征：边缘特征，线性特征，中心环绕特征，对角线特征这些特征组合为特征模板，特征模板里有白色和黑色矩形，模板特征即为白色矩形像素和减去黑色矩形像素和。 Ha…

人工智能 2023年7月18日
0070
djangorestframework-simplejwt

介绍因为jwt官方已经停止维护，且对于django4.x不支持，所以选择simplejwt(django>=2.0)一定要配合权限一起使用，不然不生效 1.使用 1.1 安…

人工智能 2023年7月29日
0067
聚类分析实验

一、实验要求在计算机上验证和测试k-means聚类和高斯混合模型聚类实验，sklearn的相关聚类算法。实验目的 1、掌握k-means聚类算法的原理 2、掌握高斯混合模型聚类…

人工智能 2023年6月2日
0081
自编码器(Autoencoder)基本原理与模型实现

自编码器(autoencoder)属于嵌入与表征学习的一种。作为深度神经网络的一类方法，它主要用于数据降维、压缩以及获取低维度表征等。自编码器与传统机器学习中的主成分分析(PCA)…

人工智能 2023年7月27日
0080
Ubuntu18.04安装CUDA11.0 Installation failed. See log at /var/log/cuda-installer.log for details.

一、出现的问题： [ERROR]: Install of driver component failed. [ERROR]: Install of 450.51.05 failed…

人工智能 2023年5月23日
0074
【20211028】【Python】统计Series/List类型的数据中某元素出现的个数

value_count() 方法 pandas 中 value_count() 是一种查看表格某列中有多少个不同值的快捷方法，并计算每个不同值在该列中有多少重复值。注意：valu…

人工智能 2023年7月7日
0069
我的Qt作品（11）使用Qt+OpenCV实现一个带旋转角度的NCC灰度模板匹配演示软件

使用Qt+OpenCV自己写了一个带旋转角度的NCC灰度模板匹配算子以及它的演示软件。算子的原理是基于NCC灰度匹配。一、什么是NCC匹配 1、基于Normalized cros…

人工智能 2023年6月22日
0087
python+OpenCV笔记（三十八）：识别手写数字——基于人工神经网络ANN

目录一、简单理解人工神经网络理解神经元和感知器理解神经网络的层二、基于人工神经网络识别手写数字流程一、（训练模块）——digits_ann.py 二、（测试模块）——d…

人工智能 2023年7月14日
0074
Python数据分析入门笔记10——简单案例练习（学生信息分析）

系列文章目录 Python数据分析入门笔记1——学习前的准备 Python数据分析入门笔记2——pandas数据读取 Python数据分析入门笔记3——数据预处理之缺失值 Pyth…

人工智能 2023年7月8日
0060
【四】gym搭建自己的环境，全网最详细版本，3分钟你就学会了！

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月22日
0053
pytorch训练BERT模型实现文本分类的详细过程

之前对BERT的预训练过程做过详细解释，文章中的代码就是一段简洁的预训练Demo代码，对于了解BERT的预训练原理有很大帮助。然后对BERT+CRF的实体识别做过详解，在这篇中对…

人工智能 2023年7月22日
0050

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31