pytorch从零搭建神经网络实现多分类(训练自己的数据集)

2023年7月1日上午5:47 • 人工智能 • 阅读 79

简介

本文介绍如何使用pytorch搭建基础的神经网络，解决多分类问题。主要介绍了两个模型：①全连接层网络；②VGG11卷积神经网络模型(下次介绍)。为了演示方便，使用了Fashion-Mnist服装分类数据集（10分类数据集，介绍可以去网上搜一下，这里不赘述），也可以在自己的制作的数据集上训练（后面会稍作介绍）。在文章最后会附上完整的可运行的代码。

1 全连接层网络

全连接层网络包括输入层、隐藏层以及输出层。其中隐藏层中可以包括多个全连接层，理论上可以加无数层，加的越多，网络的深度越深。每个全连接层中可以包含多个节点，理论上也可以无数多，节点数越多，网络宽度越宽。但实际上，网络深和宽并不意味着性能越好，需要视情况而定。
一般每一层输出后还要使用激活函数，以及一些正则化手段如dropout。

; 1.1 搭建模型

class FCNet(nn.Module):#全连接网络
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(784,512)
        self.fc2 = nn.Linear(512,256)
        self.fc3 = nn.Linear(256,128)
        self.fc4 = nn.Linear(128,64)
        self.fc5 = nn.Linear(64,10)
        self.dropout = nn.Dropout(p=0.2)

    def forward(self,x):
        x = x.view(x.shape[0],-1)
        x_1 = self.dropout(F.relu(self.fc1(x)))
        x_2 = self.dropout(F.relu(self.fc2(x_1)))
        x_3 = self.dropout(F.relu(self.fc3(x_2)))
        x_4 = self.dropout(F.relu(self.fc4(x_3)))
        x_out = F.softmax(self.fc5(x_4),1)
        return x_out

可以看出全连接网络的搭建十分简单，很容易理解。首先创建一个类，继承Module类。初始化后定义各个全连接层，此处的定义并不一定要按照顺序，但为了容易理解，一般按顺序定义。

        self.fc1 = nn.Linear(784,512)#第一层全连接层，节点数为512
        self.fc2 = nn.Linear(512,256)#第二层全连接层，节点数为256

由于Fashion-Mnist数据集的每个样本的特征点数为784（28*28的图片），因此第一层全连接层的输入节点数为784，512则代表该全连接层的输出节点数（即该全连接层有512个节点）。以此类推，若下一层全连接层的节点数为256，则将输入节点数改为512，输出改为256。
①：

        self.fc1 = nn.Linear(784,2048)#第一层全连接层，节点数为2048
        self.fc2 = nn.Linear(2048,10)#第二层全连接层，节点数为10

②：

        self.fc1 = nn.Linear(784,256)#第一层全连接层，节点数为256
        self.fc2 = nn.Linear(256,128)#第二层全连接层，节点数为128
        self.fc3 = nn.Linear(128,10)#第三层全连接层，节点数为10

实际上，对于一个全连接层网络，只需要固定输入节点数（784）和输出节点数（10）。其内部的全连接层节点数可以任意设定，例如以上①②所示都是可以的，只是效果会有差异。

        self.dropout = nn.Dropout(p=0.2)

网络定义的时候，还定义了一个dropout层，因为全连接网络的节点数较多，而相邻层的每一个节点都两两相连，因此造成网络参数量较大，随着网络的深度和宽度加大，网络容易出现过拟合的现象。因此要采用正则化的手段，dropout为其中一种手段。其他正则化手段可以到以下链接稍作了解：正则化原理的简单分析(L1/L2正则化).

1.2 前向传播

    def forward(self,x):
        x = x.view(x.shape[0],-1)
        x_1 = self.dropout(F.relu(self.fc1(x)))
        x_2 = self.dropout(F.relu(self.fc2(x_1)))
        x_3 = self.dropout(F.relu(self.fc3(x_2)))
        x_4 = self.dropout(F.relu(self.fc4(x_3)))
        x_out = F.softmax(self.fc5(x_4),1)
        return x_out

前向传播的代编写也十分简单，首先要用.view()函数对每个输入数据样本展平为1 x 784的数据，才能传入该全连接网络模型。步骤：
①将输入x输入全连接层：self.fc(x)
②使用激活函数激活：relu(self.fc1(x))
③self.dropout(F.relu(self.fc1(x)))
最后得到第一层全连接层的输出x_1。以此类推，将x_1作为第二层的输入，继续正向传播。经过最后一层全连接层的10个节点后，使用softmax层输出分类结果。softmax层的作用是输出每个类别的概率。在此网络中的应用为十分类，因此输出为1 x 10个概率。简单说，几分类则最后一层全连接层的节点数就为几。

1.3 训练

读取数据

##预处理 将图片转换为tensor 归一化
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,),(0.5,)),transforms.Resize])

##获取数据集
train = datasets.FashionMNIST('dataset/',download=True,train=True,transform=transform)
test = datasets.FashionMNIST('dataset/',download=True,train=False,transform=transform)

##批量载入
batch_size = 64
train_iter = torch.utils.data.DataLoader(train, batch_size=batch_size, shuffle=True, num_workers=4)#num_workers要设置为你的cpu线程数
test_iter = torch.utils.data.DataLoader(test, batch_size=batch_size, shuffle=False, num_workers=4)

这里使用小批量训练，batch_size设置为64，可以视情况修改。num_workers要设置为你的cpu线程数

接下来看训练代码，首先要实例化网络；定义损失函数，这里使用的是交叉熵损失函数（交叉熵函数十分适合分类问题）；定义优化器，这里使用Adam优化器，再设置epoch（训练轮数）。
具体的训练步骤参考注释：

net = FCNet()#实例化网络
lossFunc = nn.CrossEntropyLoss()#定义损失函数
optimizer = optim.Adam(net.parameters(),lr = 0.0001)#定义优化器，设置学习率
epochs = 20#训练轮数

train_loss, test_loss = [], []

print("开始训练FCNet")
for e in range(epochs):
    running_loss = 0

    for images,labels in train_iter: #小批量读取数据
        optimizer.zero_grad() #将梯度清零
        y_hat = net(images) #将数据输入网络
        loss = lossFunc(y_hat,labels) #计算loss值
        loss.backward() #误差反向传播
        optimizer.step() #参数更新
        running_loss += loss.item()## 将每轮的loss求和

    test_runningloss = 0
    test_acc = 0

    with torch.no_grad(): #验证时不记录梯度
        net.eval() #评估模式
        for images,labels in test_iter:
            y_hat = net(images)
            test_runningloss += lossFunc(y_hat,labels)
            ps = torch.exp(y_hat)
            top_p,top_class = ps.topk(1,dim=1)
            equals = top_class == labels.view(*top_class.shape)

            test_acc += torch.mean(equals.type(torch.FloatTensor))
    net.train()

    train_loss.append(running_loss/len(train_iter))
    test_loss.append(test_runningloss/len(test_iter))

    print("训练集学习次数: {}/{}.. ".format(e + 1, epochs),
          "训练误差: {:.3f}.. ".format(running_loss / len(train_iter)),
          "测试误差: {:.3f}.. ".format(test_runningloss / len(test_iter)),
          "模型分类准确率: {:.3f}".format(test_acc / len(test_iter)))

##训练结果可视化
plt.plot(train_loss,label='train loss')
plt.plot(test_loss,label='test loss')
plt.legend()
plt.show()

由loss可视化图中可以看出，loss值在20个epoch稳定下降。

完整代码

import torch
from torch import nn,optim
import torch.nn.functional as F
from torchvision import datasets,transforms
import matplotlib.pyplot as plt

##预处理 将图片转换为tensor 归一化
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,),(0.5,)),transforms.Resize])

##获取数据集
train = datasets.FashionMNIST('dataset/',download=True,train=True,transform=transform)
test = datasets.FashionMNIST('dataset/',download=True,train=False,transform=transform)

##批量载入
batch_size = 64
train_iter = torch.utils.data.DataLoader(train, batch_size=batch_size, shuffle=True, num_workers=4)
test_iter = torch.utils.data.DataLoader(test, batch_size=batch_size, shuffle=False, num_workers=4)

class PomeloFCNet(nn.Module):#全连接网络
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(784,512)
        self.fc2 = nn.Linear(512,256)
        self.fc3 = nn.Linear(256,128)
        self.fc4 = nn.Linear(128,64)
        self.fc5 = nn.Linear(64,10)
        self.dropout = nn.Dropout(p=0.2)

    def forward(self,x):
        x = x.view(x.shape[0],-1)
        x_1 = self.dropout(F.relu(self.fc1(x)))
        x_2 = self.dropout(F.relu(self.fc2(x_1)))
        x_3 = self.dropout(F.relu(self.fc3(x_2)))
        x_4 = self.dropout(F.relu(self.fc4(x_3)))
        x_out = F.softmax(self.fc5(x_4),1)
        return x_out

net = PomeloFCNet()#实例化网络
lossFunc = nn.CrossEntropyLoss()#定义损失函数
optimizer = optim.Adam(net.parameters(),lr = 0.0001)#定义优化器，设置学习率
epochs = 20#训练轮数

train_loss, test_loss = [], []

print("开始训练PomeloFCNet")
for e in range(epochs):
    running_loss = 0

    for images,labels in train_iter:
        optimizer.zero_grad()
        y_hat = net(images)
        loss = lossFunc(y_hat,labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()## 将每轮的loss求和

    test_runningloss = 0
    test_acc = 0

    with torch.no_grad():
        net.eval()
        for images,labels in test_iter:
            y_hat = net(images)
            test_runningloss += lossFunc(y_hat,labels)
            ps = torch.exp(y_hat)
            top_p,top_class = ps.topk(1,dim=1)
            equals = top_class == labels.view(*top_class.shape)

            test_acc += torch.mean(equals.type(torch.FloatTensor))
    net.train()

    train_loss.append(running_loss/len(train_iter))
    test_loss.append(test_runningloss/len(test_iter))

    print("训练集学习次数: {}/{}.. ".format(e + 1, epochs),
          "训练误差: {:.3f}.. ".format(running_loss / len(train_iter)),
          "测试误差: {:.3f}.. ".format(test_runningloss / len(test_iter)),
          "模型分类准确率: {:.3f}".format(test_acc / len(test_iter)))

plt.plot(train_loss,label='train loss')
plt.plot(test_loss,label='test loss')
plt.legend()
plt.show()

训练自己的数据集

若想要训练其他数据集，则需要修改数据读取部分代码。例如数据集为.npy格式的时候：

##读取数据
x_train = np.load('train_data.npy')#训练数据
x_train = torch.from_numpy(x_train)
x_train.float()
y_train = np.load('train_label.npy')#训练标签
y_train = torch.from_numpy(y_train)
y_train.float()

x_test = np.load('eval_data.npy')#验证数据
x_test = torch.from_numpy(x_test)
x_test.float()
y_test = np.load('eval_label.npy')#验证标签
y_test = torch.from_numpy(y_test)
y_test.float()

接下来创建dataset，使用TensorDataset()函数，将数据和标签传进去即可。num_workers数记得修改。

datasets_train = Data.TensorDataset(x_train,y_train)
train_iter = Data.DataLoader(datasets_train,batch_size=batch_size,shuffle=True,num_workers=16)
datasets_test = Data.TensorDataset(x_test,y_test)
test_iter = Data.DataLoader(datasets_test,batch_size=batch_size,shuffle=True,num_workers=16)

Original: https://blog.csdn.net/he_pomelo/article/details/118443537
Author: pomelo33
Title: pytorch从零搭建神经网络实现多分类(训练自己的数据集)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662791/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

主成分分析（PCA）详解

主成分分析（PCA)是一种比较基础的数据降维方法，也是多元统计中的重要部分，在数据分析、机器学习等方面具有广泛应用。主成分分析目的是用较少的变量来代替原来较多的变量，并可以反映原来…

人工智能 2023年7月4日
0093
一文速学-熵权法实战确定评价指标权重

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0050
在python中安装tensorflow出现错误“ERROR: Exception: Traceback (most recent call last): File……“,等系列问题

在python中安装tensorflow出现错误:“ERROR: Exception: Traceback (most recent call last): File&…

人工智能 2023年5月23日
0092
YOLOv5用TensorBoard可视化结果解读

计算公式：其中TP为正确识别的判例个数，FN为有目标但识别为没有目标的判例个数。FP为没有目标但识别为有目标的判例个数。 Precision的含义为模型正确识别的有目标判例占模…

人工智能 2023年7月10日
0086
YOLOv6 Tensorrt Python部署教程

B站教学视频 https://www.bilibili.com/video/BV1ka411p7u4/ Github仓库地址 https://github.com/Monday-L…

人工智能 2023年7月12日
0074
学会这个Python技能，就可以跟excel说再见了

资产登记，可能你想很简单，自己维护一份excel表不就行了吗？但它和设备的采购、维护和管理息息相关。领导可能随时问你”小宋，还剩多少内存条可以用啊?要不要申请维修a…

人工智能 2023年7月5日
0061
ESP IDF 开发框架构建与 ADF 语音识别框架尝试 – esp 32s

ESP-ADF ESP32 语音框架开发文档 ESP IDF 环境准备根据vscode-esp-idf-extension/docs/tutorial/install.md所描述…

人工智能 2023年5月25日
0082
torch.nn.parameter详解

CLASS torch.nn.parameter.Parameter(data=None, requires_grad=True) """ A kin…

人工智能 2023年7月12日
0059
实验二-洗衣机模糊推理实验-matlab/python

实验二洗衣机模糊推理系统实验一、实验目的理解模糊逻辑推理的原理及特点，熟练应用模糊推理。二、实验内容采用Matlad 7.0 的Fuzzy Logic Tool 设计…

人工智能 2023年7月5日
0071
图像去雾，利用《bringing old photos back to life》的开源代码

修改部分训练测试数据集下载地址修改部分增改了一些数据处理代码，Create_Bigfile2.py和Load_Bigfilev2为特定任务需要加的代码，这里数据处理用的是…

人工智能 2023年6月22日
0075
tensorflow安装测试教程【一文读懂】

🥇 版权: 本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连🎉 声明: 作为全网 AI 领域干货最多的博主之一，❤️ 不负光阴不负卿 ❤️ 🍊 精选专栏，环境搭建…

人工智能 2023年5月23日
0081
数据分析（3）数据重构

task3——数据重构学习参考资料：datawhale动手学数据分析学习链接：https://github.com/datawhalechina/hands-on-data-a…

人工智能 2023年7月8日
0094
动手实现深度学习（14）：卷积神经网络

本篇会实现一个名为 SampleNet的简单神经网络，该神经网络会使用到第九章实现的conv 操作和第十章中实现的pooling操作。SimpleNet是用来检验我们实现的Op …

人工智能 2023年6月4日
0099
Ubuntu系统下配置PyTorch环境

目录前言步骤一、NVIDIA驱动二、Anaconda安装三、Pytorch安装四、Pycharm安装前言这几天一直研究如何在ubuntu系统下安装Pytorch，中…

人工智能 2023年6月17日
0066
极限学习机ELM回归预测及其MATLAB代码实现

文章目录 1. 极限学习机ELM原理介绍 * 1.1极限学习机的训练过程 1.2 极限学习机的预测过程 2. 基于极限学习机ELM标准算法的回归预测模型建立 * 2.1 数据说明 …

人工智能 2023年6月15日
0066
【交通标志识别】基于matlab HOG特征机器学习交通标识识别【含Matlab源码 2200期】

一、SVM路标检测识别简介 1 路标识别完整的路标识别系统包括：图像的获取与预处理，图像分割（路标定位），特征提取，模式分类（路标识别）等部分。其中模式分类是系统的关键技术。较常用…

人工智能 2023年6月29日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31