PYTORCH: 60分钟 | 神经网络

2023年6月16日上午6:48 • Linux • 阅读 167

神经网络可以使用 torch.nn包构建。

现在你已经对autograd有所了解， nn依赖 autograd 定义模型并对其求微分。 nn.Module 包括层，和一个返回 output 的方法 – forward(input)。

例如，看看这个对数字图片进行分类的网络：

convnet

这是一个简单的前馈网络。它接受输入，通过一层接一层，最后输出。

一个典型的神经网络训练过程如下：

定义神经网络，并包括一些可学习的参数（或权重）
通过输入数据集迭代
通过网络处理输入
计算损失（输出和真值的差距）
将梯度反向传播至神经网络的参数
更新神经网络权重，通常使用简单的更新规则： weight = weight - learning_rate * gradient。

定义网络

让我们定义这个网络：

import torch
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        # 1&#x4E2A;&#x8F93;&#x5165;&#x56FE;&#x7247;&#x901A;&#x9053;&#xFF0C;6&#x4E2A;&#x8F93;&#x51FA;&#x901A;&#x9053;&#xFF0C;5x5&#x5E73;&#x65B9;&#x5377;&#x79EF;&#x6838;
        self.conv1 = nn.Conv2d(1, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        # &#x4E00;&#x4E2A;&#x4EFF;&#x5C04;&#x53D8;&#x6362;&#x64CD;&#x4F5C;&#xFF1A;y = Wx + b
        self.fc1 = nn.Linear(16 * 5 * 5, 120) # 5*5&#x662F;&#x7279;&#x5F81;&#x56FE;&#x7EF4;&#x5EA6;
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # &#x6700;&#x5927;&#x6C60;&#x5316;&#xFF1A;&#xFF08;2&#xFF0C;2&#xFF09;&#x7A97;&#x53E3;
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # &#x5982;&#x679C;&#x7A97;&#x53E3;&#x5927;&#x5C0F;&#x662F;&#x6B63;&#x65B9;&#x5F62;&#xFF0C;&#x53EF;&#x4EE5;&#x4F7F;&#x7528;&#x5355;&#x4E2A;&#x6570;&#x5B57;
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = torch.flatten(x, 1) # &#x5C06;&#x9664;&#x4E86;batch&#x7EF4;&#x5EA6;&#x7684;&#x6240;&#x6709;&#x7EF4;&#x5EA6;&#x5C55;&#x5E73;
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
net = Net()
print(net)

输出：

Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)

你仅仅需要定义 forward 函数， backward 函数（梯度计算）会自动使用 autograd 定义。你可以在 forward 函数上使用任何Tensor操作。

net.parameters() 返回模型的可学习参数

params = list(net.parameters())
print(len(params))
print(param[0].size()) # conv1&#x7684;&#x6743;&#x91CD;&#x53C2;&#x6570;

输出：

10
torch.size([6, 1, 5, 5])

让我们试试一个随机的32×32的输入。注意：该网络（LeNet）的输入大小是32×32。为在MNIST上使用该网络，请将图片缩放至32×32

input = torch.randn(1, 1, 32, 32)
out = net(input)
print(out)

输出：

tensor([[-0.1380, -0.0528,  0.0736,  0.1018,  0.0066, -0.1454,  0.0366, -0.0692,
          0.0182,  0.0003]], grad_fn=<addmmbackward0>)
</addmmbackward0>

使所有参数的梯度缓存归零，并反向传播一个随机梯度：

net.zero_grad()
out.backward(torch.randn(1, 10))

注意： torch.nn仅支持mini-batches。整个 torch.nn包仅支持样本的mini-batch输入，而不是单个sample。例如， nn.Conv2d将接受一个4DTensor： nSamples x nChannels x Height x width。如果是单个样本，利用 input.unsqueeze(0) 添加一个假的batch维度即可。

在继续之前，让我们回顾一下所有你迄今为止看到的所有类。

Recap：

torch.Tensor – 一个 multi-dimensional array，支持autograd操作，如 backward()。还持有关于tensor的梯度。
nn.Module – 神经网络模型。封装参数的一个便捷的途径，并且可将它们移动到GPU，输出、加载等。
nn.Parameter – 当tensor作为属性赋给 Module时，自动注册为参数。
autograd.Function – autograd的前向和后向定义的具体实现。每一个 Tensor 操作创建最少一个 Function 节点，并连接到创建 Tensor 和对其历史进行编码的函数。

以上，我们介绍了：

Defining a neural network
Processing inputs and calling backward

还剩：

计算损失
更新网络权重

损失函数

损失函数接受input的（output，target）对，计算评估output距离target的值。

在nn包中有多种不同的loss function，一个简单的损失函数是： nn.MSELoss，它计算input和target的均方误差。

例如：

output = net(input)
target = torch.randn(10) # &#x4E00;&#x4E2A;&#x5047;&#x7684;target
target = target.view(1, -1) # &#x4F7F;&#x5176;&#x4E0E;output&#x4FDD;&#x6301;&#x5F62;&#x72B6;&#x4E00;&#x81F4;
criterion = nn.MSELoss()

loss = criterion(output, target)
print(loss)

输出：

tensor(1.3339, grad_fn=<mselossbackward0>)
</mselossbackward0>

现在，如果你在后向传播中跟踪 loss，使用它的 .grad_fn 属性，你将会看到类似下面的计算图：

input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d
      -> flatten -> linear -> relu -> linear - relu -> linear
      -> MSELoss
      -> loss

因此，当我们调用 loss.backward()，整个图将被求有关神经网络参数的导数，并且图中所有 requires_grad=True的Tensors将持有梯度Tensor – .grad。

为了说明，让我们查看几步backward：

print(loss.grad_fn) # MSELoss
print(loss.grad_fn.next_functions[0][0]) # Linear
print(loss.grad_fn.next_functions[0][0].next_functions[0][0]) # Relu

输出：

<mselossbackward0 object at 0x7efad9c382b0>
<addmmbackward0 object at 0x7efad9c386d8>
<accumulategrad object at 0x7efad9c386d8>
</accumulategrad></addmmbackward0></mselossbackward0>

Backprop

为了使误差反向传播，我们需要做的仅仅是 loss.backward()。但是你需要清除现有的梯度，否则梯度将会累积到已有的梯度之中。

现在调用 loss.backward()，并查看conv1的偏置在反向传播前后的梯度。

net.zero_grad() # &#x5C06;&#x6240;&#x6709;&#x53C2;&#x6570;&#x7684;&#x68AF;&#x5EA6;&#x7F13;&#x5B58;&#x8BBE;&#x7F6E;&#x4E3A;0

print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)

loss.backward()

print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

输出：

conv1.bias.grad before backward
tensor([0., 0., 0., 0., 0., 0.])
conv1.bias.grad after backward
tensor([ 0.0061, -0.0024, -0.0051, -0.0073,  0.0014,  0.0074])

现在，我们已经知道了如何使用损失函数。

Read Later：

神经网络包中包含多种模型和损失函数，用以组成深度神经网络的构建块，完整的文档列表在这。

还剩最后一部分：

更新网络的权重

更新权重

在实践中最简单的更新方法是随机梯度下降（SGD）

weight = weight - learning * gradient

我们可以使用简单的Python代码实现SGD：

learning_rate = 0.1
for f in net.parameters():
    f.data.sub_(f.grad.data * learning_rate)

但是，当你使用神经网络时，你想使用多种不同的更新规则，如SGD、Nesterov-SGD、Adam、RMSProp，etc。为了实现这个，我们构建了一个小型的包： torch.optim，可以实现以上所有方法。使用起来也非常简单。

import torch.optim as optim

create your optimizer
optimizer = optim.SGD(net.parameters(), lr=0.01)

&#x5728;&#x8BAD;&#x7EC3;&#x5FAA;&#x73AF;&#x4E2D;&#xFF1A;
optimizer.zero_grad() # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step() # Does the update

Original: https://www.cnblogs.com/DeepRS/p/15720200.html
Author: Deep_RS
Title: PYTORCH: 60分钟 | 神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/621348/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Linux—OpenSSH服务

Linux—OpenSSH服务 OpenSSH 是 SSH (Secure SHell) 协议的免费开源实现。SSH协议可以用来进行远程控制或在计算机之间传送文件。而实现此功能的传…

Linux 2023年6月7日
00107
Git

什么是Git Git是用C语言开发的分布式版本控制系统，所谓版本控制系统，就是可以储存一个文件在不同时间的版本，记录每次文件的改动，可以根据需要，随时切换到之前的版本(比如在编写W…

Linux 2023年6月7日
00100
总结

门诊：11张张张是主表，主表之王是患者信息住院：12张张张由入院登记开始，外挂处方点评一张电子病历：12张病历概要打头来，紧接门（急）病历，急诊留观放尾中，住院病历放最后检验…

Linux 2023年6月13日
00109
Elasticsearch7.X 安装（CentOS7）

需要Java环境最低1.8起步 Elasticsearch时隔三年出来了8.0版本，最低需要JDK17 一、获取Elasticsearch7.x安装包获取链接 Elastics…

Linux 2023年6月13日
00113
在Ubuntu20.04上安装Kubernetes-Kubeadm和Minikube

镜像下载、域名解析、时间同步请点击阿里云开源镜像站在本文中，我们将了解如何在 Ubuntu 20.04 上安装 Kubernetes。在过去的几年里，容器化为开发人员提供了很大的…

Linux 2023年5月27日
00111
Centos 7.x 线上安装 Kubernetes

镜像下载、域名解析、时间同步请点击阿里云开源镜像站安装依赖包 yum install -y conntrack ntpdate ntp ipvsadm ipset jq ipta…

Linux 2023年5月27日
00127
redis

./redis-cli -a 111 KEYS "key*" | xargs ./redis-cli -a 111 DEL Original: https://…

Linux 2023年5月28日
0099
什么是进程

进程：是指计算机中已运行的程序。进程本身不是基本的运行单位，而是线程的容器。程序本身只是指令、数据及其组织形式的描述，进程才是程序（那些指令和数据）的真正运行实例。进程是程序动态…

Linux 2023年6月7日
00111
[SDR] GNU Radio 系列教程（二） —— 绘制第一个信号分析流程图

1、前言 2、启动 GNU Radio 3、新增块 4、运行本文视频参考链接 1、前言本文将介绍如何在 GNU Radio 中创建和运行第一个流程图。 2、启动 GNU Ra…

Linux 2023年6月8日
00109
到底什么是TORCH.NN？

该教程是在notebook上运行的，而不是脚本，下载notebook文件。 PyTorch提供了设计优雅的模块和类： torch.nn, torch.optim, Dataset,…

Linux 2023年6月14日
00107
Redis16个常见使用场景

目录缓存数据共享分布式分布式锁全局ID 计数器限流位统计购物车用户消息时间线timeline 消息队列抽奖点赞、签到、打卡商品标签商品筛选用户关注、推荐模…

Linux 2023年5月28日
00113
shell中参数的用法 && wait的用法

转载自https://www.jianshu.com/p/4db526ff6560 参数说明 $0 当前脚本的文件名（间接运行时还包括绝对路径） $n 传递给脚本或函数的参数。n…

Linux 2023年5月28日
0092
Linux基线加固

bash;gutter:true; 1、修改vsftp回显信息 (1)检查办法修改vsftp回显信息：需在安装VSFTP的情况下检查，未安装可忽略或禁用该项。查看ftpd_b…

Linux 2023年6月13日
0088
迭代

1.迭代的概念：迭代是重复反馈过程的活动，其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次”迭代”，而每一次迭代得到的结果会作为下一次迭代的…

Linux 2023年6月8日
00112
【转】一条 SQL 的执行过程详解

MySQL 体系架构 – 连接池组件 1、负责与客户端的通信，是半双工模式，这就意味着某一固定时刻只能由客户端向服务器请求或者服务器向客户端发送数据，而不能同时进行。 …

Linux 2023年6月13日
00130
思科CISCO ASA 5521 防火墙 Ipsec 配置详解

版本信息： Cisco Adaptive Security Appliance Software Version 9.9(2) Firepower Extensible Opera…

Linux 2023年6月6日
0098

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

PYTORCH: 60分钟 | 神经网络

定义网络

损失函数

Backprop

更新权重

大家都在看