手把手教你：基于粒子群优化算法（PSO）优化卷积神经网络（CNN）的文本分类

2023年5月26日下午8:51 • 人工智能 • 阅读 103

系列文章

手把手教你：人脸识别考勤系统

文章目录

系列文章
项目简介
一、粒子群算法（PSO）简介
二、项目展示
二、环境需求
*
环境安装实例
三、重要功能模块介绍
*
1.数据预处理模块（data_create.py）
2.定义粒子群优化算法（n_PSO.py）
3.定义被优化CNN模型
4.使用PSO优化CNN初始化学习率（ModelTrain.py）
5.模型分类预测
四、完整代码地址

项目简介

本文主要介绍如何使用python搭建：一个基于：粒子群优化算法(PSO：Particle swarm optimization) 优化CNN网络，并实现文本的分类。

博主也参考过网上其他博主介绍：粒子群优化算法（PSO）的文章，但大多是理论大于方法。并且很少有用到优化CNN或其他网络的代码。很多同学肯定对原理不需要过多了解，只需要搭建出一个分类或预测系统即可。

本文只会告诉你如何快速搭建一个基于粒子群优化算法优化CNN的系统并运行，原理的东西可以参考其他博主。

也正是因为我发现网上大多的帖子只是针对原理进行介绍，功能实现的相对很少。

如果您有以上想法，那就找对地方了！

提示：以下是本篇文章正文内容

一、粒子群算法（PSO）简介

粒子群优化算法（PSO）是一种最优化算法，源于对鸟群捕食的行为研究。粒子群优化算法的基本思想： 是通过群体中个体之间的协作和信息共享来寻找最优解．

PSO的优势：在于简单容易实现并且没有许多参数的调节。

目前已被广泛应用于函数优化、神经网络训练、模糊系统控制以及其他遗传算法的应用领域

二、项目展示

模型预测：

模型训练：

特征工程：

项目演示可以参考我在B站发的同名视频：
手把手教你：基于粒子群优化算法（PSO）优化卷积神经网络（CNN）的文本分类

; 二、环境需求

因为本项目基于TensorFlow因此需要以下环境：

tensorflow==2.0
pandas
scikit-learn
numpy
Word2Vec

环境安装实例

环境都可以通过pip进行安装。如果只是想要功能跑起来，这边建议tensorflow安装cpu版的。

如果没使用过pycharm通过pip安装包的同学可以参考如下：

点开”终端”，然后通过pip进行安装tensorflow，其他环境包也可以通过上面的方法安装。

; 三、重要功能模块介绍

1.数据预处理模块（data_create.py）

首先读取书本信息内容并构建训练数据

部分功能代码：

def read_book_path(path):
"""
    读取书本内容
    :param path:
    :return:
"""
    book_msg_list = []
    for root, dirs, files in os.walk(path):

        for author_dir in dirs:

            file_path = os.path.join(root, author_dir)
            for root_2, dirs_2, files_2 in os.walk(file_path):
                for file in files_2:

                    book_path = os.path.join(file_path, file)

                    book_name = str(file.split('.txt')[0])
                    with open(book_path, "r", encoding='utf-8') as f:
                        try:
                            txt_data = f.read()
                        except UnicodeDecodeError:
                            with open(book_path, "r", encoding='gbk') as f:
                                try:
                                    txt_data = f.read()
                                except UnicodeDecodeError as e:
                                    print(e)
                                    print("错误文件：" + str(book_path))

                                else:
                                    book_msg = [author_dir, book_name, txt_data]
                                    book_msg_list.append(book_msg)

                        else:
                            book_msg = [author_dir, book_name, txt_data]
                            book_msg_list.append(book_msg)
    return book_msg_list

def word_2_vec(data_in, words_num=2000, vec_num=128):
"""
    构建书本-文字特征向量
    :param vec_num: 单词的文本向量维度大小
    :param words_num:段落大小
    :param data_in:输入数据，格式为list：作者，书名，内容
    :return:
"""
    label_list = []
    name_list = []
    word_split_list = []

    for i in tqdm(range(len(data_in))):
        label = data_in[i][0]
        book_name = data_in[i][1]
        content = data_in[i][2]

        new_content = words_regularized(content)
        words_list = new_content.split()

        words_list = words_list[:len(words_list) - len(words_list) % words_num]

        for e in range(1, int(len(words_list) / words_num) + 1):
            word_split_list.append(words_list[(e - 1) * words_num:e * words_num])
            label_list.append(label)
            name_list.append(book_name)
    time.sleep(1)
    print("完成文本预处理，共计获取：", len(word_split_list), "个段落。")
    time_s = datetime.now()
    print("****开始预训练词向量，此处预计耗时20秒（根据文本多少变化）")

    time_e = datetime.now()
    time_cql = int((time_e - time_s).total_seconds())
    model = Word2Vec.load('models/word2vec.model')

    print("完成文本词向量特征预训练,耗时：", time_cql, "秒。", "预训练词向量保存地址：models/word2vec.model")

    words_vec_list = []
    for i in tqdm(range(len(word_split_list))):
        content = word_split_list[i]
        vec_list = []
        for word in content:
            vec = model.wv[word]
            vec_list.append(vec)
        words_vec_list.append(vec_list)
    time.sleep(1)
    print("完成特征构建。")
    return words_vec_list, label_list, name_list

def words_regularized(text):
"""
    过滤特殊符号以及还原常见缩写单词
    :param text:原始文本
    :return:处理后文本
"""

2.定义粒子群优化算法（n_PSO.py）

部分功能代码：

import numpy as np
import random
import n_model as md
import tensorflow as tf

def fit_fun(param, X):

    gpus = tf.config.experimental.list_physical_devices('GPU')
    tf.config.experimental.set_virtual_device_configuration(gpus[0], [
        tf.config.experimental.VirtualDeviceConfiguration(memory_limit=5120)])

    label_count = param['label_count']
    a_shape = param['a_shape']
    b_shape = param['b_shape']
    train_data = param['data']
    train_label = param['label']
    model = md.cnn_model(label_count, data_shape=(a_shape, b_shape))

    res_model = model.model_create(X[-1])
    history = res_model.fit(train_data, train_label, epochs=5, batch_size=8, validation_split=0.2)

    val_loss = 1 - max(history.history['val_acc'])
    return val_loss

class Particle:

    def __init__(self, model_param, x_max, x_min, max_vel, dim):
        self.__pos = [random.uniform(x_min, x_max) for i in range(dim)]
        self.__vel = [random.uniform(-max_vel, max_vel) for i in range(dim)]
        self.__bestPos = [0.0 for i in range(dim)]
        self.__fitnessValue = fit_fun(model_param, self.__pos)

    def set_pos(self, i, value):
        self.__pos[i] = value

    def get_pos(self):
        return self.__pos

    def set_best_pos(self, i, value):
        self.__bestPos[i] = value

    def get_best_pos(self):
        return self.__bestPos

    def set_vel(self, i, value):
        self.__vel[i] = value

    def get_vel(self):
        return self.__vel

    def set_fitness_value(self, value):
        self.__fitnessValue = value

    def get_fitness_value(self):
        return self.__fitnessValue

class PSO:
    def __init__(self, model_param, pso_param, best_fitness_value=float('Inf'), C1=2,
                 C2=2, W=1):
        self.C1 = C1
        self.C2 = C2
        self.W = W
        self.dim = pso_param['dim']
        self.size = pso_param['size']
        self.iter_num = pso_param['iter_num']
        self.x_max = pso_param['x_max']
        self.x_min = pso_param['x_min']
        self.max_vel = pso_param['max_vel']
        self.best_position = [0.0 for i in range(pso_param['dim'])]
        self.model_param = model_param
        self.best_fitness_value = best_fitness_value
        self.fitness_val_list = []

        self.Particle_list = [Particle(self.model_param, self.x_max, self.x_min, self.max_vel, self.dim) for i in
                              range(self.size)]

3.定义被优化CNN模型

部分功能代码：

from tensorflow import keras
from tensorflow.keras import layers, models

class cnn_model:
    def __init__(self, label_num, data_shape=(2000, 128)):

        self.num_blocks = 2

        self.filters = 64

        self.conv_size = 3

        self.label_num = label_num

        self.data_shape = data_shape
        self.loss = 'sparse_categorical_crossentropy'
        self.metrics = ['acc']

    def res_net_block(self, input_data):

        x = layers.Conv1D(self.filters, self.conv_size, activation='relu', padding='same')(input_data)
        x = layers.BatchNormalization()(x)
        x = layers.Conv1D(self.filters, self.conv_size, activation=None, padding='same')(x)

    def model_create(self, learning_rate):

4.使用PSO优化CNN初始化学习率（ModelTrain.py）

import os
from collections import Counter
import numpy as np
from n_PSO import PSO
import n_model as md
import tensorflow as tf
import json

if __name__ == '__main__':

    data, label, label_count = load_data()

    train_data, train_label, val_data, val_label = create_train_data(data, label, 0.9)

    a_shape = data.shape[1]
    b_shape = data.shape[2]

    model_param = {
        "a_shape": a_shape,
        "b_shape": b_shape,
        "label_count": label_count,
        "data": train_data,
        "label": train_label
    }
"""
    用粒子群优化算法对训练模型初始化参数进行优化
"""

    dim = 1

    size = 5

    iter_num = 20

    x_max = 0.01

    x_min = 0.00001

    max_vel = 0.0005

    pso_param = {
        "dim": dim,
        "size": size,
        "iter_num": iter_num,
        "x_max": x_max,
        "x_min": x_min,
        "max_vel": max_vel
    }

    pso = PSO(model_param, pso_param)

    best_err, best_learn_rate = pso.update()
    print("粒子群优化后最优准确率为:", 1 - best_err)
    print("粒子群优化后最优初始化learning_rate:", best_learn_rate)

    os.path.join("app210323")
    best_param = {
        "acc": 1 - best_err,
        "learn_rate": best_learn_rate,
    }
    b = json.dumps(best_param)
    file = open('models/pso_out_param.json', 'w')
    file.write(b)
    file.close()
"""
    使用最优化初始参数进行训练
"""

    model = md.cnn_model(label_count, data_shape=(a_shape, b_shape))

    cnn_model = model.model_create(best_learn_rate)

5.模型分类预测

import tensorflow as tf
import numpy as np
from collections import Counter
from tensorflow import keras

from sklearn.metrics import roc_curve, roc_auc_score, classification_report, accuracy_score

if __name__ == '__main__':

    gpu_memory = 5120
    gpus = tf.config.experimental.list_physical_devices('GPU')

    tf.config.experimental.set_virtual_device_configuration(gpus[0], [
        tf.config.experimental.VirtualDeviceConfiguration(memory_limit=gpu_memory)])

    print("检查GPU是否可用：", tf.test.is_gpu_available())

    val_data, val_label = load_data()

    model_path = 'models/cnn_model_epoch-30_valAcc-0.94545454.h5'
    model = keras.models.load_model(model_path)
    print("模型：", model_path, "。加载成功！")
    print("*****完成预处理，进行模型评估*****")
    y_pred = model.predict(val_data)
    y_pred = [np.argmax(x) for x in y_pred]
    print('------------------测试集上得分：------------------------')
    print('*' * 5)
    print('测试集准确率得分:', accuracy_score(val_label, y_pred))
    print('*' * 5)
    print('准确率、召回率、f1-值测试报告如下:\n', classification_report(val_label, y_pred))

四、完整代码地址

由于项目代码量较大，感兴趣的同学可以下载完整代码，使用过程中如遇到任何问题可以私信我，我都会一一解答。

完整代码下载：
手把手教你：基于粒子群优化算法（PSO）优化卷积神经网络（CNN）的文本分类

Original: https://blog.csdn.net/weixin_43486940/article/details/118701303
Author: 大雾的小屋
Title: 手把手教你：基于粒子群优化算法（PSO）优化卷积神经网络（CNN）的文本分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521942/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[Python] pop()函数

pop()函数用于移除列表中的一个元素(默认最后一个元素)，并且返回该元素的值 list.pop([index=-1]) 要移除列表元素的索引值，不能超过列表总长度，默认为inde…

人工智能 2023年7月5日
0094
COCO数据集解析生成语义分割mask

COCO数据集解析生成语义分割mask 通过coco数据集的标注文件 — instances_train2014.json / instances_val2014.json 生成语…

人工智能 2023年6月17日
0094
mtcnn人脸检测算法介绍

0. 概述 MTCNN(Multi-task Cascaded Convolutional Networks，多任务卷积神经网络)，是2016年由Kaipeng Zhang、Zha…

人工智能 2023年7月12日
0057
realsense ros 三维点云地面检测与障碍物聚类

1.realsense点云坐标转换链接：机器人运动学坐标变换 – 百度文库 1.1、绕轴旋转矩阵 1.2、角度正负判断： 1.3、左乘右乘判断：动坐标系和静坐标系 …

人工智能 2023年5月31日
0090
Hyperledger Fabric组织的动态添加和删除

前言在Fabric定制联盟链网络工程实践中，我们虚拟了一个工作室的联盟链网络需求，并根据此需求分析了整个网络的架构且已经完成了一个简单 fabric 网络模型。本文将在其基础上，…

人工智能 2023年6月4日
0074
聚类分析实验报告作业

聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程，聚类就是一种发现这种内在结构的技术，聚类技术经常被称为无监督学习。 k 均值聚类是最著名的划分聚类算法，由于简洁和效…

人工智能 2023年6月19日
0076
实体对齐——阅读笔记

实体对齐实体对齐简介：不同的只是图谱对同一个实体的描述，会有差异。通过知识融合可以将不同知识图谱中的只是进行互补融合。实体对齐的目的：判断两个或者多个不同信息来源的实体是否为指…

人工智能 2023年6月1日
00111
pytorch 实现图像分类+web部署

介绍我们本次实现的目标是将本地的图像分类或者目标检测等等深度学习算法部署成web在线预测的形式。效果图如下，在线图像分类网站大概的设计是有五个可以选择的模型，第二步是可以选择一些…

人工智能 2023年7月23日
0083
Python机器学习、深度学习库总结（内含大量示例，建议收藏）

Python机器学习、深度学习库总结（内含大量示例，建议收藏） * – 前言 – python常用机器学习及深度学习库介绍 – 总结与分类 &#…

人工智能 2023年6月16日
0081
kaggle房价预测-回归模型

目录 1 项目背景 2 初始数据分析目标值分析特征与目标值相关性变量特征相关性 3 数据预处理目标变量正态分布化异常值处理缺失值处理转换特征保存训练集和测试集 4 …

人工智能 2023年6月12日
0072
一元回归线性下降算法

import pandas as pdimport numpy as np df = pd.read_csv(‘data.txt’, header=None…

人工智能 2023年6月17日
0066
从零开始学数据分析之——《微积分》第五章定积分

5.1 定积分的概念与性质 5.1.1 定积分问题举例 1.曲边梯形的面积 2.变速直线运动的路程 5.1.2 定积分的概念定积分的定义设函数f(x)在区间[a,b]上有定义，…

人工智能 2023年7月16日
0069
聚类效果评估、内部指标（Jaccard系数、FM指数、Rand指数）、外部指标（DB指数、Dunn指数）、轮廓系数（Silhouette Coefficient）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0055
ML参数及ResNet中Pre-activation和post-activation的区别

batch_size:多少个数据为一个批次进行梯度更新。 batch：以batch_size为单位，将数据集划分为多少个batch。batch=total size/batch_s…

人工智能 2023年5月31日
0083
Python自动化办公：读取pdf文档

在后台回复【阅读书籍】即可获取python相关电子书~ Hi，我是山月。上次给大家介绍了，但它主要用于文档的处理，比如合并、提取页面等。但是对于pdf文档来说，如何读取它的内…

人工智能 2023年6月11日
00159
银行全面数字化：看本质、抓关键、建平台

数据经济时代，数字化转型浪潮滚滚而来，各大银行也开始了全面的数字化转型。然而，由于业务复杂、数据庞大、精细度要求高，对于数据的应用存在难题。如何从内而外进行全面数字化？可以看看这个…

人工智能 2023年7月16日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

手把手教你：基于粒子群优化算法（PSO）优化卷积神经网络（CNN）的文本分类

文章目录

环境安装实例

1.数据预处理模块（data_create.py）

2.定义粒子群优化算法（n_PSO.py）

3.定义被优化CNN模型

4.使用PSO优化CNN初始化学习率（ModelTrain.py）

5.模型分类预测

大家都在看