pytorch简单神经网络搭建和训练实例

2023年7月22日上午5:04 • 人工智能 • 阅读 61

文章目录

1. 背景
2. 数据格式转换
3. 网络搭建
4. 模型训练
5. 预测
6. 总结
背景

使用pytorch的框架搭建一个简单多分类神经网络模型，解决水果分类问题。本文包括对数据格式的转换、网络构架、模型训练、预测，并未进行后续的优化，目的在于对流程的熟悉。

数据格式转换

从原始数据到标准格式的一系列处理


import pandas as pd
import sklearn
from sklearn.model_selection import train_test_split
from sklearn.feature_selection import SelectKBest, chi2
from sklearn.preprocessing import OneHotEncoder, OrdinalEncoder,MinMaxScaler, StandardScaler
import torch.nn as nn
import torch.nn.functional as F
import torch
from torch import optim
from torch.utils.data import Dataset,DataLoader

data=pd.read_csv('/Users/guidongzhang/Desktop/Data Mining/fruit/Date_Fruit_Datasets.csv')

def normalize(x):
    scaler = StandardScaler()
    return scaler.fit_transform(x)

def selectFeatures(x,y,n):
    select=SelectKBest(k=n)
    return select.fit_transform(x,y)

y=data['Class'].values
X=data.drop('Class',1)
X=normalize(X)
SelectedFeatures=selectFeatures(X,y,10)

encoder = OneHotEncoder()
encoder.fit(y.reshape(len(y), 1))
y = encoder.transform(y.reshape(len(y), 1))
y=y.toarray()

x_train,x_test,y_train,y_test=train_test_split(SelectedFeatures,y,test_size=0.2)

x_train=torch.tensor(x_train,dtype=torch.float)
x_test=torch.tensor(x_test,dtype=torch.float)
y_train=torch.tensor(y_train,dtype=torch.float)
y_test=torch.tensor(y_test,dtype=torch.float)

下面要进行一步重要的转换，为了训练的方便，我们先要将数据转化为 torch.utils.data中的 Dataset类，再转化为 DataLoader类。
首先创建一个 Dataset的子类，必须包含 __init__ __getitem__ __len__。其中 __getitem__ 的作用是给定index能输出对应的特征及标签， __len__ 输出数据的长度。 DataLoader将 Dataset对象或自定义数据类的对象封装成一个迭代器，同时可以实现多进程、shuffle、不同采样策略，数据校对等等处理过程。
由于我的数据并非图像数据，流程做了一定简化，详细查看Pytorch构建数据集。


class MyDataset(Dataset):
    def __init__(self,feature,target):
        super(MyDataset, self).__init__()
        self.feature =feature
        self.target = target
    def __getitem__(self,index):
        item=self.feature[index]
        label=self.target[index]
        return item,label
    def __len__(self):
        return len(self.feature)

bs=64
train_data=MyDataset(x_train,y_train)
train_data=DataLoader(train_data, batch_size=bs, shuffle=True)

网络搭建

典型的卷积神经网络通常由以下三种层结构共同组成：卷积层(Convolution)、下采样池化层(Pooling)、全连接层(Fully connected)，以及激活函数。由于我们的例子是简单多分类问题，不需要卷积和池化操作，使用线性全连接层和非线性激活函数即可。
在这里使用两层全连接层，第一层的激活函数使用ReLU，第二层使用Sigmoid。

class Model(nn.Module):
    def __init__(self,in_features,out_features):
        super().__init__()
        self.linear1 = nn.Linear(in_features, 10, bias = True)
        self.linear2 = nn.Linear(10, out_features, bias = True)
        self.relu=nn.ReLU()
        self.sig=nn.Sigmoid()

    def forward(self, x):
        s=self.linear1(x)
        s=self.relu(s)
        s=self.linear2(s)
        s=self.sig(s)
        return s

打印出的网络结构：

Model(
  (linear1): Linear(in_features=20, out_features=10, bias=True)
  (relu): ReLU()
  (linear2): Linear(in_features=10, out_features=7, bias=True)
  (sig): Sigmoid()
)

模型训练

模型训练分为几个流程：

定义损失函数和优化器
完成向前传播
计算损失
反向传播
梯度更新
梯度清零

损失函数使用平均绝对误差（MAE），优化算法使用随机梯度下降（SGD）。我们将这个流程封装起来。 batchdata为 dataloader类数据， lr为学习率， gamma为优化算法参数， epochs为遍历次数。


def fit(net, batchdata, lr, gamma, epochs):

    criterion =  nn.L1Loss()

    opt = optim.SGD(net.parameters(), lr = lr, momentum = gamma)

    samples = 0

    corrects = 0

    for epoch in range(epochs):

        for batch_idx, (x,y) in enumerate(batchdata):

            sigma = net.forward(x)

            loss = criterion(sigma, y)

            loss.backward()

            opt.step()

            opt.zero_grad()

            samples += x.shape[0]

            if (batch_idx + 1) % 200 == 0 or batch_idx == (len(batchdata) - 1):

                print("Epoch{}:[{}/{} {: .0f}%], Loss:{:.6f} ".format(
                    epoch + 1
                    , samples
                    , epochs*len(batchdata.dataset)
                    , 100*samples/(epochs*len(batchdata.dataset))
                    , loss.data.item()))

设置参数并开始训练:


torch.manual_seed(51)

net = Model(10,7)

lr = 0.15

gamma = 0.8

bs = 64

epochs = 50

train_data=MyDataset(x_train,y_train)
train_data=DataLoader(train_data, batch_size=bs, shuffle=True)

fit(net, train_data, lr, gamma, epochs)

打印进度及损失:

预测

预测的方法就是将待预测数据输入训练好的模型，进行向前传播， net.forward(x_test)。我们有七个种类，之前的one-hot编码中，将每一个种类用一维、长度为7的向量表示，对应的位置为1，其余位置为0。
输出的结果也是这样7 × 1 7\times1 7 ×1的向量，我们选取其最大数对应的位置作为预测结果，计算准确率。


def Accuracy(l1,l2):
    l1,l2=np.array(l1),np.array(l2)
    s=np.count_nonzero(l1-l2,axis=None)/len(l1-l2)
    return 1-s

最终我们模型的准确率达到了0.62。

总结

本文提供了用pytorch构建神经网络解决实际问题的一个案例，介绍了pytorch使用的大致流程，可以作为学习的参考。如果想进一步了解神经网络的原理及pytorch使用的更多细节，建议观看视频系统学习。

Original: https://blog.csdn.net/BernardDong/article/details/125495796
Author: Bernard.Dong
Title: pytorch简单神经网络搭建和训练实例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708463/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像处理常用术语解释

Image Signal processing(图像信号处理) 常用英文缩写术语：术语解释ISPImage Signal processingIPUImage Processin…

人工智能 2023年6月21日
0074
深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)——python代码

深度学习之卷积神经网络中常用模型评估指标(混淆矩阵，精确率，召回率，特异度计算方法)：混淆矩阵，精确率，召回率，特异度作为卷积神经网络的模型性能评价指标，它们的计算和绘制具有非常…

人工智能 2023年6月16日
0071
DCT水印嵌入与提取_(Python Version)

文章目录摘要介绍方法 * 1. 步骤 2. 代码 3. 实验现象水印嵌入相关Link 更新内容-加入攻击以及指标计算参考资料 ; 摘要在变换域进行嵌入水印有更好的鲁棒性…

人工智能 2023年6月17日
00119
【读点论文】Searching for MobileNetV3 集合了多项热门技术通道注意力，神经网络搜索，V1，V2。建议深度学习MnasNet和NetAdapt两篇论文

Searching for MobileNetV3 MobileNet v3发表于2019年，该v3版本结合了v1的深度可分离卷积、v2的Inverted Residuals和Li…

人工智能 2023年7月14日
00119
pytorch安装

（一）安装Anaconda 1、详细步骤这里不多说。anaconda安装时会自带安装相应的python版本。安装完成后，可以运行cmd，使用conda –version…

人工智能 2023年7月20日
0067
【神经网络量化】——非线性激活函数sigmoid，tanh的量化推理

sigmoid, tanh, 量化推理在嵌入式设备，ARM的M系列，或者存硬件实现网络的推理，这时就需要所有的运算都需要用int型（int8，int15）或者自定义的数据类型。这…

人工智能 2023年7月13日
0062
软件智能：为高智商的程序赋能情商？—-暨 aaas全貌

前天，我说的是，aaas乍一看像什么-智能机床。结果是一个AI系统；昨天我思考了 aaas本身是什么-纯粹形式。结论是一个突现的过程本体。（内容只是初步完成还需要增加点内容才能…

人工智能 2023年6月1日
0077
【概念认知】关于“体系”概念的个人认识

一、体系是什么？体系：泛指一定范围内或同类事物按照一定的秩序和联系组合的整体，如工业体系、思想体系等。总则为一、化则无穷、反之亦然，这就是体系。三、个人举例类比项目管理中项目…

人工智能 2023年6月30日
00100
图像相似算法最全总结

图像相似算法比如有图像A和图像B，分别计算两幅图像的直方图，HistA，HistB，然后计算两个直方图的归一化相关系数（巴氏距离，直方图相交距离）等等。这种思想是基于简单的数学…

人工智能 2023年6月17日
0073
python支持double吗_Python==如何适用于float/double？

不，你不能认为这会一直有效。在为了实现这一点，您需要知道Pandas在写入CSV文件时写出的文本值在读回时恢复为完全相同的值(再次使用Pandas)。但默认情况下，Pandasr…

人工智能 2023年7月8日
0080
论文阅读：Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking——OC-SORT

前言文章的一作是曹金坤，作者同时还是《TransTrack: Multiple Object Tracking with Transformer》的二作。文章：https://a…

人工智能 2023年7月27日
0051
R语言glm模型预测（predict）过程及Error in eval(predvars, data, env) 错误原因

R语言glm模型预测（predict）过程及Error in eval(predvars, data, env) 错误原因目录 R语言glm模型预测（predict）过程及Err…

人工智能 2023年5月31日
0093
Anacoda + pytorch 环境下安装 DGL_GPU

首先假设您已安装了 pytorch 虚拟环境在 cmd 中输入命令查看 cuda 版本 nvcc –version 打开 https://www.dgl.ai/pages/st…

人工智能 2023年6月16日
0083
什么是推荐系统？推荐系统类型、用例和应用

推荐系统是机器学习的一类，它可使用数据来帮助预测、缩小范围，并找到人们在呈指数级增长的选项中寻找的内容。什么是推荐系统？推荐系统是一种人工智能或人工智能算法，通常与机器学习相关…

人工智能 2023年6月23日
0056
Python中拼音库PyPinyin的使用

PyPinyin库是一个支持中文转拼音输出的Python第三方库，它可以根据词组智能匹配最正确的拼音，并且支持多音字，简单的繁体, 注音，多种不同拼音/注音风格的转换。 PyPin…

人工智能 2023年7月5日
0072
改进YOLOv5系列：增加Swin-Transformer小目标检测头

最新创新点改进博客推荐 -💡统一使用 YOLO 代码框架，结合不同模块来构建不同的YOLO目标检测模型。 🔥 《芒果书》系列改进专栏内的改进文章，均包含多种模型改进方式，均适用于…

人工智能 2023年6月16日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch简单神经网络搭建和训练实例

文章目录

大家都在看