如何使用PyTorch构建一个简单的神经网络

2024年1月4日下午6:23 • 人工智能 • 阅读 32

介绍

本文将详细介绍如何使用PyTorch构建一个简单的神经网络。我们将使用一个开源数据集作为我们的训练数据，通过神经网络实现对数据的分类任务。我们将通过算法原理、公式推导、计算步骤和复杂Python代码示例的方式来解决这个问题。

算法原理

神经网络是一种模拟人脑神经网络的计算模型。它由多个神经元组成，每个神经元接收输入信号并通过激活函数将其转换为输出信号。神经网络通过训练数据来调整网络中的权重和偏差，以便能够实现对新数据的准确分类。

我们将使用一个基本的全连接神经网络模型来解决一个分类问题。模型的输入是数据的特征，输出是数据的标签，其中每个标签对应于一种特定的类别。我们将使用交叉熵损失函数来度量模型输出与真实标签之间的差异，并使用梯度下降优化算法来更新模型的权重和偏差，以最小化损失函数。

公式推导

前向传播

在介绍公式之前，我们先定义一些符号和变量:
– $X$表示输入特征矩阵，维度为$N \times M$，其中$N$表示数据样本的数量，$M$表示特征的维度。
– $W$表示网络的权重矩阵，维度为$M \times C$，其中$C$表示类别的数量。
– $b$表示网络的偏差矩阵，维度为$C$。
– $Z$表示神经网络的线性输出，维度为$N \times C$。
– $A$表示神经网络的激活输出，维度为$N \times C$。

前向传播的计算过程如下：
$$Z = X \cdot W + b$$
$$A = \text{softmax}(Z)$$

其中，softmax函数定义为：
$$\text{softmax}(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{C}e^{z_j}}$$

反向传播

反向传播用于计算损失函数对神经网络中的权重和偏差的梯度。我们使用交叉熵损失函数来度量模型输出与真实标签之间的差异，定义为：
$$L = -\sum_{i=1}^{N}\sum_{j=1}^{C}[y_{ij} \log(a_{ij})]$$
其中，$y_{ij}$表示样本$i$的真实标签是否为类别$j$（1为真，0为假），$a_{ij}$表示样本$i$在类别$j$上的预测概率。

对于权重矩阵$W$和偏差矩阵$b$，它们的梯度计算可以分别表示为：
$$\frac{\partial L}{\partial W} = X^T \cdot (A – Y)$$
$$\frac{\partial L}{\partial b} = \text{sum}(A – Y)$$

其中，$Y$是真实标签的独热编码矩阵。

计算步骤

加载并预处理数据集。
定义神经网络模型结构。
定义损失函数和优化器。
进行模型训练：前向传播、计算损失、反向传播、更新参数。
进行模型测试：前向传播、计算准确率。

复杂Python代码示例

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

# 1. 加载并预处理数据集
train_data = ...
test_data = ...

train_loader = DataLoader(train_data, batch_size=32, shuffle=True)
test_loader = DataLoader(test_data, batch_size=32, shuffle=False)

# 2. 定义神经网络模型结构
class SimpleNet(nn.Module):
 def __init__(self, input_dim, output_dim):
 super(SimpleNet, self).__init__()
 self.fc = nn.Linear(input_dim, output_dim)

 def forward(self, x):
 out = self.fc(x)
 return out

input_dim = train_data.shape[1]
output_dim = len(train_data.classes)
model = SimpleNet(input_dim, output_dim)

# 3. 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 4. 进行模型训练
for epoch in range(num_epochs):
 for inputs, labels in train_loader:
 optimizer.zero_grad()

 outputs = model(inputs)
 loss = criterion(outputs, labels)
 loss.backward()
 optimizer.step()

# 5. 进行模型测试
total = 0
correct = 0
with torch.no_grad():
 for inputs, labels in test_loader:
 outputs = model(inputs)
 _, predicted = torch.max(outputs.data, 1)
 total += labels.size(0)
 correct += (predicted == labels).sum().item()

accuracy = correct / total
print('Accuracy: {:.2f}%'.format(100 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls accuracy))

代码细节解释

我们使用PyTorch提供的DataLoader来加载数据集，并设置batch_size和shuffle参数。
自定义一个继承自nn.Module的神经网络模型类SimpleNet，其中forward函数实现了前向传播的计算过程。
使用交叉熵损失函数nn.CrossEntropyLoss()来度量模型输出与真实标签之间的差异。
使用随机梯度下降优化算法optim.SGD来更新模型的权重和偏差，并设置学习率为0.01。
在每个epoch中，对训练集中的每个batch进行训练。每个batch的输入数据通过模型得到预测输出，计算损失函数，然后进行反向传播和参数更新。
在测试阶段，禁用梯度计算torch.no_grad()，对测试集进行预测并计算准确率。

以上就是使用PyTorch构建一个简单神经网络的详细解决方法，包括算法原理、公式推导、计算步骤和复杂Python代码示例，并解释了代码中的细节。通过理解和实践这些内容，你将能够构建和训练自己的神经网络模型来解决分类问题。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823855/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

同学，你这简历上没项目啊！

作者：朱小五大家好，我是小五🧐 同学，刚毕业或者转行去求职数据分析师的时候，你遭遇过这样的尴尬怪圈吗？比方说下面的jd就很真实：今天小五就跟大家聊聊，面试数据分析师时，如何彻…

人工智能 2023年7月17日
0071
Anaconda创建环境及环境配置

Anaconda创建环境及环境配置 1-创建环境 2-激活环境 3-删除环境 4-退出环境 5-注 1-创建环境前情提要：默认你已经安装 _anaconda_的基础上。以下操…

人工智能 2023年7月4日
0083
Error occurred when finalizing GeneratorDataset iterator: Failed precondition: Python interpreter st

使用tensorflow.keras模型训练时这个错误经常报： tensorflow/core/kernels/data/generator_dataset_op.cc:107] …

人工智能 2023年5月23日
0086
如何用Python读写Excel文件

目录前言从文件读数据 * 读取xls文件 – 打开工作簿获取工作表读取行读取列读取单元格读取xlsx文件 – 打开工作簿获取工作表读取行数…

人工智能 2023年7月14日
0078
构建自己的gym训练环境巨详细

环境中主要有六个模块，下面将主要以官方的MountainCarEnv为例对每个模块进行说明。 1. init 主要作用是初始化一些参数如在MountainCarEnv中，对car…

人工智能 2023年7月27日
0064
web前端设计与开发期末作品旅游咨询网站 HTML5期末大作业 HTML+CSS旅游社网站5个页面关于制作网页主题论述

👨‍🎓静态网站的编写主要是用 HTML DⅣV+ CSSJS等来完成页面的排版设计👩‍🎓，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js…

人工智能 2023年6月30日
0040
mac m1 m2 深度学习环境（pytorch）配置

1、开发工具安装建议使用pycharm。可以选择专业版或者社区版本 PyCharm：JetBrains为专业开发者提供的Python IDE 2、安装包管理工具建议使用anac…

人工智能 2023年7月21日
0081
一文搞定 Visual Studio 配置 OpenCV环境

在 Visual Studio 上配置 OpenCV 环境是极其恼人的事情，尤其是对于初学者，经常几个小时过去了都配不好，将我们对代码的热爱扼杀在摇篮之中。本文根据本人的无数次环境…

人工智能 2023年6月19日
0068
成功解决AttributeError: Parent variable ‘＜Variable: ID (dtype = numeric)＞‘ is not the index of entity En

成功解决AttributeError: Parent variable ” is not the index of entity En 解决问题解决思路解决方法解…

人工智能 2023年7月7日
0047
Distill文章-A gentle introduction to graph Neural Networks（图神经网络是怎么构造的）

目录 1 简介 2 图的介绍 3 数据如何表示成图 4 三大类问题 5 将机器学习（神经网络）用在图上，会遇到什么挑战 6 最简单的GNN 7 信息传递（把图结构的信息考虑进去） …

人工智能 2023年7月12日
0054
Pytorch学习笔记(五):nn.AdaptiveAvgPool2d()函数详解

相关文章 Pytorch学习笔记(一):torch.cat()模块的详解Pytorch学习笔记(二):nn.Conv2d()函数详解Pytorch学习笔记(三):nn.BatchN…

人工智能 2023年6月25日
0093
随机森林回归是一种回归算法，它是通过对多个决策树回归模型的预测结果进行平均或投票来进行预测的。它通过减小单一决策树的过拟合倾向来提高模型的泛化性能

问题介绍随机森林回归是一种回归算法，它通过对多个决策树回归模型的预测结果进行平均或投票来进行预测。通过减小单一决策树的过拟合倾向来提高模型的泛化性能。本文将详细介绍随机森林回归的…

人工智能 2023年12月31日
0041
【PCL自学：Feature5】视点特征直方图VFH概念及使用 (持续更新)

一、视点特征直方图（VFH）原理这篇博文描述了视点特征直方图(Viewpoint Feature Histogram[VFH])描述符，在一些其他文章也称为视角特征直方图，这是一…

人工智能 2023年5月31日
0067
CNN人脸识别项目（dlib+opencv）

CNN人脸识别获取数据集读取数据集数据预处理建立模型进行预训练对图片进行人脸进行检测并进行可视化总结思路：一个CNN人脸识别项目首先必不可少的是数据集，获取的方式有网…

人工智能 2023年5月23日
0096
处理数据时，遇到缺失值与异常值怎么办？

缺失值：是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。异常值：异常值是指数据集中存在不合理的值，又称离群点。一…

人工智能 2023年6月11日
00129
基于Django Web框架(Python)实现简单的学生管理系统 ——-学习笔记

学生管理系统Web开发 Python之Django笔记作者:bug智造者-小刘我把程序代码运行在云服务器上了，这里献上网址项目地址：首页注意：点击”欢迎使用学生…

人工智能 2023年7月6日
0061

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30