如何在PyTorch中创建神经网络模型

2024年1月3日下午11:03 • 人工智能 • 阅读 39

介绍

在PyTorch中创建神经网络模型是一个重要的任务，它允许我们使用神经网络来解决图像分类、目标检测、自然语言处理等各种机器学习问题。本节将详细介绍如何在PyTorch中创建一个简单的全连接神经网络模型，并使用开源数据集MNIST进行训练和测试。

算法原理

全连接神经网络是一种最基本的神经网络模型，它由一个或多个全连接层组成。每个全连接层都由多个神经元组成，在前一层的每个神经元和下一层的每个神经元之间都存在连接权重。通过这些连接权重，神经网络可以学习到输入和输出之间的复杂关系。训练过程中会使用反向传播算法来更新这些连接权重，以使得神经网络能够更准确地预测输出。

公式推导

本节，我们将使用以下符号表示全连接神经网络的输入、输出和参数：
– 输入：$x \in \mathbb{R}^n$
– 输出：$y \in \mathbb{R}^m$
– 权重参数：$W \in \mathbb{R}^{m \times n}$
– 偏置参数：$b \in \mathbb{R}^m$

全连接层的计算可以表示为：
$$y = Wx + b$$

我们将使用交叉熵损失函数来度量预测结果和真实标签之间的差异。交叉熵损失函数的表达式如下：
$$\text{loss} = -\frac{1}{N}\sum_{i=1}^{N}y_i\log(\hat{y_i})$$

其中，$N$是训练样本的数量，$y_i$是真实标签，$\hat{y_i}$是神经网络的预测输出。

计算步骤

加载MNIST数据集并进行预处理。
构建全连接神经网络模型。
定义损失函数和优化器。
进行模型训练。
评估模型性能。

复杂Python代码示例

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms

# Step 1: 加载MNIST数据集并进行预处理
transform = transforms.Compose([
 transforms.ToTensor(),
 transforms.Normalize((0.1307,), (0.3081,))
])

train_dataset = datasets.MNIST('data/', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST('data/', train=False, transform=transform)

train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1000, shuffle=False)

# Step 2: 构建全连接神经网络模型
class NeuralNetwork(nn.Module):
 def __init__(self):
 super(NeuralNetwork, self).__init__()
 self.fc = nn.Linear(784, 10) # 输入层为784维，输出层为10维

 def forward(self, x):
 x = x.view(x.size(0), -1)
 x = self.fc(x)
 return x

model = NeuralNetwork()

# Step 3: 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

# Step 4: 进行模型训练
def train(model, train_loader, criterion, optimizer, epochs):
 for epoch in range(epochs):
 for batch_idx, (inputs, targets) in enumerate(train_loader):
 optimizer.zero_grad()
 outputs = model(inputs)
 loss = criterion(outputs, targets)
 loss.backward()
 optimizer.step()

 if batch_idx % 100 == 0:
 print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
 .format(epoch+1, epochs, batch_idx+1, len(train_loader), loss.item()))

train(model, train_loader, criterion, optimizer, epochs=5)

# Step 5: 评估模型性能
def test(model, test_loader):
 model.eval()
 correct = 0
 total = 0
 with torch.no_grad():
 for inputs, targets in test_loader:
 outputs = model(inputs)
 _, predicted = torch.max(outputs.data, 1)
 total += targets.size(0)
 correct += (predicted == targets).sum().item()
 print('Accuracy on test set: {:.2f}%'.format(100 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls correct / total))

test(model, test_loader)

代码细节解释

Step 1中，我们使用torchvision.datasets.MNIST加载MNIST数据集，并使用transforms进行预处理，例如将图像转为张量、进行归一化等。
Step 2中，我们创建了一个继承自nn.Module的神经网络模型类NeuralNetwork，其中定义了一个全连接层self.fc，输入层大小为784，输出层大小为10。
Step 3中，我们选择了交叉熵损失函数和随机梯度下降优化器。
Step 4中，我们定义了训练函数train，通过迭代训练数据集来更新模型参数。
Step 5中，我们定义了测试函数test，通过计算模型在测试数据集上的准确率来评估模型性能。
最后，我们调用train和test函数进行模型的训练和测试，输出了训练过程中的损失值和测试准确率。

通过以上步骤，我们完成了在PyTorch中创建全连接神经网络模型的过程，并使用MNIST数据集进行了训练和测试。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823644/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

神经网络多输出回归_为什么线性回归也是神经网络

今天我们来讲讲线性回归和神经网络的关系。首先说结论，线性回归其实也是个神经网络，其实不光是线性回归，多项式回归，逻辑回归等等也都可以看成是一个神经网络。考虑到大家可能对线性回归…

人工智能 2023年6月18日
0094
分类——生成模型

分类：概率生成模型 Classification: Probabilistic Generative Model 回归做分类？NO！ ——用Regreesion强制做Classif…

人工智能 2023年7月1日
0052
怎么解决小程序里引入网络字体包后小程序模拟器上能够正常加载显示而真机上却加载不了显示不出来的问题

效果展示小程序因为包大小的原因，需要把字体文件放到网络资源上，要想在真机上也能够正常显示字体，这时候请求的字体的网络资源文件头需要满足如下条件：下载的字体文件的响应头中必须包含…

人工智能 2023年6月30日
0069
用神经网络进行回归预测 weight_decay为异常值（大于1 的值）模型效果好的原因解析

weight_decay越大越好的原因研究发生的问题特此记录之前在用神经网络来做一个回归问题，回归的数值范围是0~1之间。然后进行网格搜参（搜索最好的weight_decay和…

人工智能 2023年7月13日
0039
【材料整理】 –Pytorch基础知识1

文章目录文章目录写在前面 Pytorch加载数据初认识 Tensorboard Transform dataloader的使用 ; 写在前面本系列内容主要是对小土堆的《Pyt…

人工智能 2023年7月14日
0054
对抗攻击方法一览

神经网络在过去的几年和几十年已经获得了长足的进步，神经网络的应用已经遍布我们生活的各个角落。但是与此同时，也有人发现神经网络并不像我们预期的那么具有鲁棒性，仅仅在图片中添加一个微笑…

人工智能 2023年6月4日
00154
Pytorch中计算余弦相似度、欧式距离、范数 (捋清pairwise distance, norm, 详解cdist)

设a,b分别为两个tensor import torch import torch.nn as nn a = torch.tensor([1,2],dtype=float) b =…

人工智能 2023年6月15日
0054
2021/11/13

使用cvpods对《End-to-End Object Detection with Fully Convolutional Network》复现论文简介作者提供的代码链接：h…

人工智能 2023年7月12日
0051
OpenAI ChatGPT注册试用全攻略

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0045
Pytorch实战[使用VGG16实现图片分类]

实现Pytorch完成类别分类 Object 基本掌握使用pytorch框架进行神经网络训练任务使用Pycharm,Google Colab完成代码编写本次实验只是来熟悉一下训…

人工智能 2023年6月30日
0063
常见的超参数有哪些

问题：关于常见的超参数有哪些？超参数（Hyperparameters）是在机器学习算法中，需由研究人员手动设置的参数，而不是通过训练数据自动获得。这些参数对于模型的性能和行为具有…

人工智能 2024年1月6日
0053
EMNLP 2020 | 基于超边融合的文本增强知识图谱开放域问答

©PaperWeekly 原创 · 作者｜舒意恒学校｜南京大学硕士生研究方向｜知识图谱论文标题： Open Domain Question Answering based o…

人工智能 2023年6月1日
0075
神经网络的搭建

神经网络的搭建接下来我们来构建如下图所示的神经网络模型： tf.Keras中构建模有两种方式，一种是通过Sequential构建，一种是通过Model类构建。前者是按一定的顺序对…

人工智能 2023年7月14日
0062
pycharm安装pytorch

在pycharm上安装pytorch时候，踩了不少坑，终于安装好了。下面是教程： 1.安装前的准备工作最好先将conda或者pip的镜像源更换为国内的镜像，否则会报莫名其妙的超时…

人工智能 2023年7月22日
0095
CUDA、cuDNN、Pytorch、TensorFlow、Keras以及Python的对应版本总结

文章目录 * – 一、CUDA和cuDNN对应版本 – + 1.1 CUDA驱动和CUDAToolkit对应版本 + 1.2 CUDA和cuDNN对应版本 …

人工智能 2023年5月25日
00177
文档级关系抽取介绍

0、数据集介绍文档级关系抽取的数据集有DocRED、SCIREX、CDR、GDR。 GDA是生物医学领域的一个大规模数据集，它包含29192篇文档以供训练，其任务是预测基因和疾病…

人工智能 2023年6月1日
00240

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30