【机器学习】04. 神经网络模型 MLPClassifier分类算法与MLPRegressor回归算法（代码注释，思路推导）

2023年6月30日下午1:42 • 人工智能 • 阅读 103

资源下载

拿来即用，所见即所得。
项目仓库：https://gitee.com/miao-zehao/machine-learning/tree/master

【机器学习】04. 神经网络模型 MLPClassifier分类算法与MLPRegressor回归算法（代码注释，思路推导）

; 1. MLPClassifier分类算法

1.a 读取数据并进行归一化

题目：a) 神经网络对数据的范围敏感，在训练之前需要对数据进行归一化，将特征数据缩放到区间[-1,1];

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
orgin_data=pd.read_csv("data1.csv").values
data=orgin_data[:,0:2]
print(data)

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(data)
print(sizeOfOne_data)

1.b MLPClassifier多层神经网络

题目：b) 采用sklearn库中的MLPClassifier多层神经网络函数或者MATLAB神经网络工具箱，构建包含两个隐含层的多层神经网络。网络结构为：输入层2个神经元，第一个隐含层包含5个神经元，第二个隐含层包含2个神经元，输出结果为2分类；

解读：题目要求输入层2个神经元，就是我们的输入数据X的维度为2，题目没有指定激活函数和求解优化器，我测试过了”sgd”优化器，但是效果很差，只有0.5的准确度，而且分界线是一条直线，最后我反复测试了多个优化器，选择了”lbfgs”（quasi-Newton方法的优化器），hidden_layer_sizes 控制我们的隐藏层，hidden_layer_sizes 维度表示其层数。

hidden_layer_sizes :例如hidden_layer_sizes=(5, 2)，表示有两层隐藏层，第一层隐藏层有5个神经元，第二层也有2个神经元。
activation :激活函数,{‘identity’, ‘logistic’, ‘tanh’, ‘relu’}, 默认relu
identity：f(x) = x
logistic：其实就是sigmod,f(x) = 1 / (1 + exp(-x)).
tanh：f(x) = tanh(x).
relu：f(x) = max(0, x)
solver： {‘lbfgs’, ‘sgd’, ‘adam’}, 默认adam，用来优化权重
lbfgs：quasi-Newton方法的优化器
sgd：随机梯度下降
adam： Kingma, Diederik, and Jimmy Ba提出的机遇随机梯度的优化器
注意：默认solver ‘adam’在相对较大的数据集上效果比较好（几千个样本或者更多），对小数据集来说，lbfgs收敛更快效果也更好。
alpha :float,可选的，默认0.0001,正则化项参数
batch_size : int , 可选的，默认’auto’,随机优化的minibatches的大小batch_size=min(200,n_samples)，如果solver是’lbfgs’，分类器将不使用minibatch
learning_rate :学习率,用于权重更新,只有当solver为’sgd’时使用，{‘constant’，’invscaling’, ‘adaptive’},默认constant

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

orgin_data=pd.read_csv("data1.csv").values

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(orgin_data)

X=sizeOfOne_data[:,0:2]
Y=sizeOfOne_data[:,2:].astype('int').ravel()

X_train, X_test, Y_train, Y_test = train_test_split(X, Y,test_size=0.2,random_state=0)

mpl = MLPClassifier(hidden_layer_sizes=(5, 2), activation='logistic',solver='lbfgs')

mpl.fit(X_train, Y_train.ravel())

print('Score:\n', mpl.score(X_test, Y_test))

1.c 对模型分类结果进行可视化

题目：可视化网络分类结果

常规的绘图，但是这次不同于之前for循环分类标签值为0和1，用了np数组的特性。

class1_x = X[Y == 0, 0]
class1_y = X[Y == 0, 1]

上面的代码可以很方便的进行标签分类。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

orgin_data=pd.read_csv("data1.csv").values

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(orgin_data)

X=sizeOfOne_data[:,0:2]
Y=sizeOfOne_data[:,2:].astype('int').ravel()

X_train, X_test, Y_train, Y_test = train_test_split(X, Y,test_size=0.2,random_state=0)

mpl = MLPClassifier(hidden_layer_sizes=(5, 2), activation='logistic',solver='lbfgs')

mpl.fit(X_train, Y_train.ravel())

print('Score:\n', mpl.score(X_test, Y_test))

h = 0.02
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
Z = mpl.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contourf(xx, yy, Z, cmap='summer')

class1_x = X[Y == 0, 0]
class1_y = X[Y == 0, 1]
l1 = plt.scatter(class1_x, class1_y, color='b', label="0")
class2_x = X[Y == 1, 0]
class2_y = X[Y == 1, 1]
l2 = plt.scatter(class2_x, class2_y, color='r', label="1")
plt.legend(handles=[l1, l2], loc='best')
plt.grid(True)
plt.savefig("1/1.c MLPClassifier多层神经网络可视化.png")
plt.show()

为了进一步对比分析，我们也绘制一下原始数据（没有任何归一化等处理）绘制的坐标图

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
orgin_data=pd.read_csv("data1.csv").values

arry_1=[]
arry_0=[]
for i in orgin_data:
    if i[2].astype('int')==1:
        arry_1.append(i[0:2])
    elif i[2].astype('int')==0:
        arry_0.append(i[0:2])
arry_1=np.array(arry_1)
arry_0=np.array(arry_0)

plt.rcParams["font.sans-serif"]=["SimHei"]
plt.rcParams['axes.unicode_minus']=False
plt.title("分类散点图图")
plt.xlabel("特征1")
plt.ylabel("特征2")

plt.scatter(arry_1[:,0],arry_1[:,1],label='x',marker = "x")
plt.scatter(arry_0[:,0],arry_0[:,1],label='o',marker = "o")

plt.legend(['类别1','类别0'], loc=2, fontsize=10)

plt.savefig("1/1.c 绘制数据原始二维分类图.png")
plt.show()

yuanshi

分析

我们可以看到，归一化对于数据的影响还是很大的，数据明显变得密集了。

我们的分类效果还是比较好的，模型的精确度可以达到1.0（当然我觉得原因在于样本点确实比较少，也不太好判断是否过拟合）

MLPRegressor回归算法

题目：
a) 神经网络对数据的范围敏感，在训练之前需要对数据进行归一化，将特征数据缩放到区间[-1,1];
b) 输入层13个神经元，自定义神经网络的隐含层数（建议不超过3层）以及每个隐含层的节点数，建立波士顿房价的预测模型。
c) 通过设置多组不同的网络结构（隐含层数量不同或者隐含层神经元数量不同），建立多个神经网络模型，并进行比较分析。

大体过程和前面的 MLPClassifier差不多，就是数据的接口有所区别。为了做到C题的要求，我们封装一个函数来对比预测得分。

2.1 模型训练

hidden_layer_sizes :例如hidden_layer_sizes=(5, 2, 2)，表示有3层隐藏层，第一层隐藏层有5个神经元，第二层有2个神经元,第三层也有2个神经元
activation :激活函数, {‘identity’, ‘logistic’, ‘tanh’, ‘relu’}, 默认relu
identity：f(x) = x
logistic：其实就是sigmod,f(x) = 1 / (1 + exp(-x)).
tanh：f(x) = tanh(x).
relu：f(x) = max(0, x)
solver： {‘lbfgs’, ‘sgd’, ‘adam’}, 默认adam，用来优化权重
lbfgs：quasi-Newton方法的优化器
sgd：随机梯度下降
adam： Kingma, Diederik, and Jimmy Ba提出的机遇随机梯度的优化器

注意：默认solver ‘adam’在相对较大的数据集上效果比较好（几千个样本或者更多），对小数据集来说，lbfgs收敛更快效果也更好。

alpha :float,可选的，默认0.0001,正则化项参数
batch_size : int , 可选的，默认’auto’,随机优化的minibatches的大小batch_size=min(200,n_samples)，如果solver是’lbfgs’，分类器将不使用minibatch
learning_rate :学习率,用于权重更新,只有当solver为’sgd’时使用，{‘constant’，’invscaling’, ‘adaptive’},默认constant
max_iter : 迭代次数，int, optional, default 200。函数达到收敛的最大迭代次数。设置过少的话可能出现迭代的时候迭代总数超过了限制导致程序函数无法收敛。如下图的报错：

ConvergenceWarning: lbfgs failed to converge (status=1):
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

import time

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import  MLPRegressor

orgin_data = pd.read_csv("boston.csv")

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(orgin_data)

X = sizeOfOne_data[:, 0:13]
Y = sizeOfOne_data[:, 13:]

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=0)

def creat_train(hidden_layer_sizes):
    time_begin=time.time()
    mpl = MLPRegressor(hidden_layer_sizes=(5, 2, 2), activation='logistic', solver='lbfgs',max_iter=400)

    mpl.fit(X_train, Y_train.ravel())

    print('Score:\n', mpl.score(X_test, Y_test))
    time_cost = time.time()-time_begin
    print('time_cost:\n', time_cost)
    print("--------------")

creat_train((5, 2, 2))
creat_train((5, 5, 2))
creat_train((5, 5, 5))

分析

分别对应
creat_train((5, 2, 2))
creat_train((5, 5, 2))
creat_train((5, 5, 5))
的运行得分和时间。

; 2.2 可视化

随着模型的神经网络层数增加，模型确实是提高了得分。但是可视化后发现了问题。

import time

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import  MLPRegressor
import matplotlib.pyplot as plt

orgin_data = pd.read_csv("boston.csv")

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(orgin_data)

X = sizeOfOne_data[:, 0:13]
Y = sizeOfOne_data[:, 13:]

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=0)

def creat_train(hidden_layer_sizes):
    time_begin=time.time()
    mpl = MLPRegressor(hidden_layer_sizes=(5, 2, 2), activation='logistic', solver='lbfgs',max_iter=400)

    mpl.fit(X_train, Y_train.ravel())

    print('Score:\n', mpl.score(X_test, Y_test))
    time_cost = time.time()-time_begin
    print('time_cost:\n', time_cost)
    print("--------------")

    plt.rcParams["font.sans-serif"] = ["SimHei"]
    plt.rcParams['axes.unicode_minus'] = False
    plt.title("(错版)实际房价与预测房价")
    plt.xlabel("数据序号")
    plt.ylabel("房价")
    predict_Y=mpl.predict(X)

    plt.plot([x for x in range(1,len(X)+1)], predict_Y, label='预测房间')
    plt.plot([x for x in range(1,len(X)+1)], Y, label='实际房价')

    plt.legend(['预测房间', '实际房价'], loc=2, fontsize=10)

    plt.savefig("2/2.2 (错版)实际房价与预测房价.png")
    plt.show()

creat_train((5, 2, 2))

修改了参数，改变激活函数。但是偶尔还是会出现上面的那种情况（收敛的特别凑巧的情况吧）

import time

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.neural_network import  MLPRegressor
import matplotlib.pyplot as plt

orgin_data = pd.read_csv("boston.csv")

max_abs_scaler = preprocessing.MaxAbsScaler()
sizeOfOne_data = max_abs_scaler.fit_transform(orgin_data)

X = sizeOfOne_data[:, 0:13]
Y = sizeOfOne_data[:, 13:]

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=0)

def creat_train(hidden_layer_sizes):
    time_begin=time.time()
    mpl = MLPRegressor(hidden_layer_sizes=(5, 2, 2), activation='relu', solver='lbfgs',max_iter=300)

    mpl.fit(X_train, Y_train.ravel())

    print('Score:\n', mpl.score(X_test, Y_test))
    time_cost = time.time()-time_begin
    print('time_cost:\n', time_cost)
    print("--------------")

    plt.rcParams["font.sans-serif"] = ["SimHei"]
    plt.rcParams['axes.unicode_minus'] = False
    plt.title("实际房价与预测房价")
    plt.xlabel("数据序号")
    plt.ylabel("房价")
    predict_Y=mpl.predict(X)

    plt.plot([x for x in range(1,len(X)+1)], predict_Y, label='预测房间')
    plt.plot([x for x in range(1,len(X)+1)], Y, label='实际房价')

    plt.legend(['预测房间', '实际房价'], loc=2, fontsize=10)

    plt.savefig("2/2.2 实际房价与预测房价.png")
    plt.show()

creat_train((5, 2, 2))

分析异常

我们在分类问题的时候使用 logistic激活函数，但是可视化后就出现了问题，会导致出现预测值是一条平缓的水平线的问题（ logistic激活函数取中为用，把上下极值往中庸数据拉进，这样显然会使得我们的预测结果很差。）

所以我该用了激活函数为ReLu函数。ReLu函数的优点就是在应用梯度下降法是收敛较快，当输入值为整数时，不会出现梯度饱和的问题，因为大于0的部分是一个线性关系，这个优点让ReLu成为目前应用较广的激活函数。

总结

大家喜欢的话，给个👍，点个关注！给大家分享更多有趣好玩的python机器学习知识！

发现你走远了@mzh原创作品，转载必须标注原文链接

Crated：2022-9-23

欢迎关注『机器学习』系列，持续更新中
欢迎关注『机器学习』系列，持续更新中
【机器学习】01. 波士顿房价为例子学习线性回归
 【机器学习】02. 使用sklearn库牛顿化、正则化的逻辑回归
 【机器学习】03. 支持向量机SVM库进行可视化分类
 【机器学习】04. 神经网络模型 MLPClassifier分类算法与MLPRegressor回归算法
 【机器学习】05. 聚类分析
 【机器学习】07. 决策树模型DecisionTreeClassifier
【机器学习】08. 深度学习CNN卷积神经网络keras库
【更多内容敬请期待】

Original: https://blog.csdn.net/u011027547/article/details/127013156
Author: 发现你走远了
Title: 【机器学习】04. 神经网络模型 MLPClassifier分类算法与MLPRegressor回归算法（代码注释，思路推导）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661397/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

恒源云(GPUSHARE)_基于梯度的NLP对抗攻击方法

文章来源 | 恒源云社区（专注人工智能/深度学习云GPU服务器训练平台，官方体验网址：gpushare.com/ ）原文地址 | https://bbs.gpushare.com…

人工智能 2023年7月3日
0072
一些一看就明白的DEMO

这里写目录标题 CONTENT * JButton的actionListener 画折线图 CONTENT JButton的actionListener btnNewButton_…

人工智能 2023年6月28日
0063
yolov3数据集–bdd100k

最新更新：因为训练过模型，我发现有些类别mAP太低,然后就想去掉train这个类别,但发现一个新问题:官方下的那个train的大json文件似乎存在数据缺失?我用了两个小项目尝试将…

人工智能 2023年6月10日
00101
【自动驾驶决策规划】PRM算法

1 基于采样的路径规划方法路径搜索常用方式之一是基于网格的的方法（grid-based method），如A*算法，但基于网格的方法复杂度较高，与求解空间的维度相关，且得到的路径…

人工智能 2023年6月10日
00257
PyTorch中的优化算法有哪些常见的选择

优化算法在PyTorch中的常见选择在PyTorch中，有许多常见的优化算法可供选择。这些算法使用梯度信息更新模型参数，以便训练模型更好地拟合训练数据。本文将详细介绍三种常见的优…

人工智能 2024年1月5日
0035
ORB-SLAM3代码详解—-基本框架解析及ORB特征提取

一个典型的视觉SLAM系统主要包含数据处理、初始化、视觉里程计、地图维护、闭环检测等部分。 1.1 关键技术解析 1.1.1 初始化关键技术解析初始化：主要就是以第一帧图像为参考…

人工智能 2023年6月23日
0070
基于Matlab人脸识别(PCA算法)

摘要随着科技的发展，人类社会的进步，传统身份识别由于容易遗失，容易被破解已不能起到身份识别作用。人们需要更加安全可靠的身份识别技术。而生物特征的独一无二，不易丢失和被复制的特性很…

人工智能 2023年6月23日
0078
基于Yolov5目标检测的物体分类识别及定位 — 全过程总结

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月24日
0054
pycharm配置python环境

文章目录 * – + 安装pycharm + 安装python + pycharm配置python,并激活 + pycharm界面 + 运行一下 + 取消更新安装py…

人工智能 2023年7月4日
0037
no module named matplotlib PyCharm无法引用matplotlib的问题

运行代码时遇到： no module named matplotlib 首先检查pip list 其次进入Anaconda Prompt 环境检查了conda list也存在mat…

人工智能 2023年5月25日
0082
【YOLO系列】YOLO V1 论文精读与学习总结

目录 0. 前言 1.YOLO V1 大体思路 2. YOLO V1的训练过程 * 2.1 YOLO V1网络结构 2.2 具体训练过程 – 2.2.1 把主干结构在I…

人工智能 2023年7月9日
0078
基于Maven的Mybatis开发环境搭建

回答1：很高兴为您提供关于spark+eclipse+java+ 在windows 及入门实例的详细步骤和代码。 1. 安装Java JDK 首先，您需要在Windows上安装J…

人工智能 2023年6月29日
0080
超参数调优框架optuna（可配合pytorch）

目录前言一、optuna的使用流程二、结果可视化三、pytorch代码使用optuna 前言在深度学习快速发展的今天，对于不同深度学习模型的超参数优化（hyperpara…

人工智能 2023年7月22日
00101
高翔ORB-SLAM2稠密建图编译（添加实时彩色点云地图+保存点云地图）

目录前言 * 系统版本一、准备工作 * 下载源码二、编译 ./build.sh * 1.删除一些build文件夹 2.创建 Vocabulary 文件夹 3.在CMakeLi…

人工智能 2023年7月26日
0054
YOLOV5目标检测记录

文章目录 1、运行官网YOLOV5代码 * 1、下载源代码 2、文件夹解析 3、开始测试 – 1、图片测试 2、视频测试 3、摄像头实时测试 2、训练自己的神经网络模型…

人工智能 2023年7月12日
0087
如何使用Anaconda创建Tensorflow环境？

Tensorflow框架与Python之间存在着明确的版本对应关系，若安装版本不匹配，则后期会出现各种报错情况。为此，在安装之前要确定好所要安装的版本。若是不明确对应版本的同学，可…

人工智能 2023年5月25日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31