Pytorch：全连接神经网络-MLP分类

2023年6月30日下午6:49 • 人工智能 • 阅读 91

Pytorch: 全连接神经网络-多层感知机解决分类问题

copyright: Jingmin Wei, Automation 1801, School of Artificial and Intelligence, Huazhong University of Science and Technology

Pytorch教程专栏链接

文章目录

*
–
+ Pytorch: 全连接神经网络-多层感知机解决分类问题
– @[toc]
–
+
* MLP 垃圾邮件分类
* 数据准备与探索
* 搭建网络并可视化
* 使用预处理后的数据训练模型
* 获取中间层的输出并可视化
*
– 使用中间层的输出
– 使用钩子获取中间层的输出

全连接神经网络MLP，或者叫多层感知机，采用BP算法实现，也叫BP神经网络，属于前馈神经网络。由输入层，输出层和隐藏层构成。输入层的神经元个数与输入的特征数量相同，隐藏层和输出层神经元对信号进行加工处理，最终结果由输出层神经元输出。

接下来探讨MLP在分类和回归任务中的应用。

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.manifold import TSNE

import torch
import torch.nn as nn
from torch.optim import SGD, Adam
import torch.utils.data as Data
import matplotlib.pyplot as plt
import seaborn as sns
import hiddenlayer as hl
from torchviz import make_dot

MLP 垃圾邮件分类

数据准备与探索

数据集下载地址：http://archive.ics.uci.edu/ml/datasets/Spambase

数据库说明：48个关键词频率，6个关键字符，1个大写字母不间断的平均长度，1个大写字母不间断的最大长度，一个大写字母变量，最后1个为带预测目标变量。

spam = pd.read_csv('./data/spambase/spambase.data')
spam.head()

word_freq_makeword_freq_addressword_freq_allword_freq_3dword_freq_ourword_freq_overword_freq_removeword_freq_internetword_freq_orderword_freq_mail…char_freq_;char_freq_(char_freq_[char_freq_!char_freq_$char_freq_#capital_run_length_averagecapital_run_length_longestcapital_run_length_totallabel00.000.640.640.00.320.000.000.000.000.00…0.000.0000.00.7780.0000.0003.75661278110.210.280.500.00.140.280.210.070.000.94…0.000.1320.00.3720.1800.0485.1141011028120.060.000.710.01.230.190.190.120.640.25…0.010.1430.00.2760.1840.0109.8214852259130.000.000.000.00.630.000.310.630.310.63…0.000.1370.00.1370.0000.0003.53740191140.000.000.000.00.630.000.310.630.310.63…0.000.1350.00.1350.0000.0003.537401911

5 rows × 58 columns


pd.value_counts(spam.label)

0    2788
1    1813
Name: label, dtype: int64


X = spam.iloc[:,0: 57].values
y = spam.label.values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=123)


scales = MinMaxScaler(feature_range=(0, 1))
X_train_s = scales.fit_transform(X_train)

X_test_s = scales.fit_transform(X_test)


colname = spam.columns.values[:-1]
plt.figure(figsize=(20, 14))
for ii in range(len(colname)):
    plt.subplot(7, 9, ii + 1)
    sns.boxplot(x = y_train, y = X_train_s[:, ii])
    plt.title(colname[ii])
plt.subplots_adjust(hspace = 0.4)
plt.show()

有些特征在两种类型的分布上有较大差异

搭建网络并可视化


class myMLP(nn.Module):
    def __init__(self):
        super(myMLP, self).__init__()

        self.hidden1 = nn.Sequential(
            nn.Linear(in_features=57,
                      out_features=30,
                      bias=True
                      ),
            nn.ReLU()
        )

        self.hidden2 = nn.Sequential(
            nn.Linear(30, 10),
            nn.ReLU()
        )

        self.classify = nn.Sequential(
            nn.Linear(10, 2),
            nn.Sigmoid()
        )

    def forward(self, x):
        fc1 = self.hidden1(x)
        fc2 = self.hidden2(fc1)
        output = self.classify(fc2)
        return fc1, fc2, output


from torchsummary import summary
testnet = myMLP()
summary(testnet, input_size=(1, 57))

`
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.01
Estimated Total Size (MB): 0.01

Original: https://blog.csdn.net/weixin_44979150/article/details/122778457
Author: 宅家的小魏
Title: Pytorch：全连接神经网络-MLP分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661857/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

链家租房数据基本分析

import pandas as pd lj_data = pd.read_csv(‘LJdata.csv’) #原始列名 lj_data.columns #Index([‘区域’…

人工智能 2023年7月8日
0084
pandas计数函数：value_counts( )和counts( )的使用

介绍一下如何在python里使用value_counts( )和counts( )进行计数。一、counts( )函数 1、count()在字符串里的使用函数体及主要参数： c…

人工智能 2023年7月14日
0060
【下班神器】python写自动关机程序并打包成exe文件

文章目录前言实现效果实现步骤 * 💻 模块导入 💻 窗口设置 💻 创建一个文本标签 💻 创建一个文本标签和时间栏框 💻 设置该文件的字体样式和大小 💻 创建一个日期时间文本框…

人工智能 2023年7月3日
0061
yolov5模型压缩之模型剪枝

目前看来，yolo系列是工程上使用最为广泛的检测模型之一。yolov5检测性能优秀，部署便捷，备受广大开发者好评。但是，当模型在前端运行时，对模型尺寸与推理时间要求苛刻，轻量型模型…

人工智能 2023年7月29日
0060
复盘：基于attention的多任务多模态情绪情感识别，基于BERT实现文本情感分类（pytorch实战）

复盘：基于attention机制的多任务多模态情绪情感识别（pytorch实战），基于BERT实现文本情感分类 提示&#xFF1…

人工智能 2023年7月21日
00111
【PyTorch】7 文本分类TorchText实战——AG_NEWS四类别新闻分类

使用 TorchText 进行文本分类 1.访问原始数据集迭代器 2. 准备数据处理管道 3. 生成数据批次和迭代器 4. 定义模型 5. 初始化一个实例 6. 定义训练模型和评估…

人工智能 2023年7月2日
0087
机器学习中数据集的划分

机器学习中数据集的划分 1.如何划分数据集 2.数据集的划分方法 * 1.留出法（Hold-out） 2.交叉验证法（Cross Validation） 3.自助法（BootStr…

人工智能 2023年6月15日
00154
YOLOV7训练自己的数据集，我先来试试火（VisDrone数据集）

源码：https://github.com/WongKinYiu/yolov7论文：https://arxiv.org/abs/2207.02696 这个yolov7是yolov4…

人工智能 2023年6月24日
00117
使用PyMetis实现聚类融合算法

在Java中需要用到一些机器学习相关的库，比如Weka、Apache Mahout等。下面以Weka为例，简单介绍如何 Java 。 1. 导入Weka库在Java工程中导入W…

人工智能 2023年7月15日
0067
《Linux与Python 编程 R》–实验指导书（2020）

目录实验一 Linux系统安装与使用基础 * 【目的与要求】【实验内容】实验二 Python程序运行方式和程序流程控制 * 【目的与要求】【实验内容】实验三 Python…

人工智能 2023年7月5日
0071
机器学习GPU环境配置

目录 ANACONDA&Pycharm 版本对应关系(经过官网测试) TensorFlow&keras CUDA CUDNN 配置测试 ANACONDA&P…

人工智能 2023年6月16日
0098
R语言包ggplot2绘制多组箱线图

本文记录于2021年6月28日，2022年11月14日更新，如果内容有误，请私信或评论，我会在第一时间进行更正。由于许多人好像对 ggplot2所需要的数据的结构不是很清楚，那么…

人工智能 2023年6月15日
0090
实体对齐算法_知识图谱中的实体对齐方法及装置与流程

本发明涉及计算机领域，具体而言，涉及一种知识图谱中的实体对齐方法及装置。背景技术：在构建大规模知识库的任务中，需要处理大量来自多源知识库的实体数据。在构建知识库之初，首先需建立…

人工智能 2023年6月1日
0068
模型蒸馏1

两种蒸馏形式：模型蒸馏（模型压缩，模型不同，特征相同）优势特征蒸馏（大模型使用全量特征，适用于模型相同，特征不同）俩种训练方式： pre-train是预先训练teacher…

人工智能 2023年6月25日
0065
GNN（图神经网络）基本概念

功能：节点分类和图分类空域：空间上考虑图结构的模型，即考虑目标节点和其他节点的几何关系(有无连接)。模型代表：GAT（Graph Attention Networks）图…

人工智能 2023年7月26日
0048
R语言分类变量独立性检验（Tests of independence）、使用Fisher精确检验fisher.test函数检验分类变量的独立性（ test of independence）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月2日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31