PyTorch是如何实现自动求导的

2024年1月3日上午10:14 • 人工智能 • 阅读 39

问题背景介绍

PyTorch是一个广泛应用于深度学习的开源框架，其中一个重要的功能是它能够自动计算和优化张量的导数。这种自动求导技术使得深度学习的模型训练过程更加简化。本文将详细介绍PyTorch是如何实现自动求导的。

自动求导原理

自动求导是通过计算导数来调整模型参数以最小化损失函数。PyTorch使用反向自动求导技术（也称为反向传播）来实现自动求导。在介绍反向传播之前，我们先介绍一些必要的数学理论。

假设我们有一个函数$f(\mathbf{x})$，其中$\mathbf{x}$是一个向量。我们想要计算函数$f$相对于$\mathbf{x}$的导数$\frac{\partial f}{\partial \mathbf{x}}$。根据链式法则，我们可以将导数表示为雅可比矩阵的乘积形式：

$$\frac{\partial f}{\partial \mathbf{x}} = \frac{\partial \mathbf{y}}{\partial \mathbf{x}} \cdot \frac{\partial f}{\partial \mathbf{y}}$$

其中$\mathbf{y}$是函数$f$的中间变量。

在反向传播中，PyTorch将此雅可比矩阵进行分解，从而计算出相对于每个变量的导数。这使得求导过程更加高效。

计算步骤

PyTorch中自动求导的计算步骤如下：

定义输入张量以及需要计算的变量，包括模型参数；
定义模型结构，将输入张量和模型参数通过各种计算操作组合在一起；
定义损失函数，将模型的输出与目标值进行比较，得到损失值；
使用反向传播计算损失相对于模型参数的导数；
根据导数对模型参数进行更新；
重复步骤2-5，直到满足停止条件（如达到最大迭代次数）。

代码示例

下面是一个使用PyTorch实现线性回归模型并进行自动求导的示例。

首先，我们导入必要的库和模块：

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

接下来，我们定义一个简单的线性回归模型类：

class LinearRegression(nn.Module):
 def __init__(self):
 super(LinearRegression, self).__init__()
 self.linear = nn.Linear(1, 1) # 输入维度为1，输出维度为1

 def forward(self, x):
 return self.linear(x)

然后，我们生成一些虚拟数据，用于训练模型：

np.random.seed(0)
torch.manual_seed(0)

# 生成随机数据
x = np.random.rand(100, 1)
y = 2 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls x + 1 + np.random.randn(100, 1) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 0.1

# 转换为Tensor
x_tensor = torch.from_numpy(x).float()
y_tensor = torch.from_numpy(y).float()

接着，我们定义损失函数和优化器：

model = LinearRegression()
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

接下来，我们使用反向传播计算模型参数的导数并进行优化：

# 训练模型
num_epochs = 100
for epoch in range(num_epochs):
 # 前向传播
 outputs = model(x_tensor)
 loss = criterion(outputs, y_tensor)

 # 反向传播与优化
 optimizer.zero_grad()
 loss.backward()
 optimizer.step()

 # 打印训练信息
 if (epoch + 1) % 10 == 0:
 print('Epoch [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, loss.item()))

最后，我们可以对模型进行预测并绘制结果图：

# 绘制结果
predicted = model(x_tensor).detach().numpy()
plt.plot(x, y, 'ro', label='Original data')
plt.plot(x, predicted, label='Fitted line')
plt.legend()
plt.show()

代码细节解释

在定义模型时，我们使用nn.Linear创建了一个线性模型，并将其作为LinearRegression类的一个成员变量。
在前向传播中，我们将输入$x$传递给线性模型，并返回其输出。
损失函数采用均方误差（MSE）来度量模型输出与目标值之间的差异。
优化器选择随机梯度下降（SGD），用于更新模型中的参数。
在每个epoch中，我们将梯度清零（optimizer.zero_grad()），然后进行前向传播、损失计算和反向传播。最后，我们使用优化器来更新模型参数。
通过调用.detach().numpy()，我们将模型预测结果转化为NumPy数组，以便于后续的绘图。

这是一个简单的使用PyTorch实现自动求导的示例。通过反向传播技术，PyTorch能够高效地计算和优化张量的导数，从而实现深度学习模型的训练过程。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823506/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

计算机视觉（相机标定；内参；外参；畸变系数）

目录一、预备知识 1、坐标系变换过程（相机成像过程）（1）相机坐标系转换为图像坐标系（透视投影变换遵循的是针孔成像原理）（2）齐次坐标的引入原因：（为什么引入齐次坐标？？？）…

人工智能 2023年5月26日
00272
用GPU加速神经网络训练

前言本文记录了做毕设过程中，为了加速神经网络的训练，如何让tf能识别到GPU并加速，加速前resnet架构一个epoch需要跑40分钟，使用mx150（一个laptop的极普通显…

人工智能 2023年7月13日
0064
【Pytorch】data.norm（几种范数(norm)的详细介绍）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月24日
0073
传奇开服很难吗？教你怎么给Hero传奇引擎添加NPC

一般人们用官方里面的NPC形象代码但是找不到这个代码因为我们发现用这个wil查看器查看到的第一个npc的数据除以六十得不到我们想要的npc 比如说铁匠是一号他占的位置是0…

人工智能 2023年6月28日
0073
数学建模（四）：分类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
0043
卡尔曼滤波器之扩展卡尔曼滤波

参考文献：【１】https://zhuanlan.zhihu.com/p/63641680 目录１．非线性模型２．非线性模型到线性模型的近似１．非线性模型《卡尔曼滤波器之…

人工智能 2023年5月26日
00101
模型整合之模型堆叠——详细理解Stacking model

详细理解Stacking model 如果你得到了10个不一样的model，并且每个model都各有千秋，这个时候你该怎么选？想必你一定是很为难吧，但通过集成方法，你可以轻松的将1…

人工智能 2023年7月28日
0058
C++ Reference: Standard C++ Library reference: C Library: cwctype: wctype

C++官网参考链接：https://cplusplus.com/reference/cwctype/wctype/ 函数 string passed asproperty desc…

人工智能 2023年6月29日
00102
知识图谱–第三章：知识存储（1）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0058
【Computer Vision】基于卷积神经网络实现美食分类

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月2日
0048
PyTorch中的数据加载和数据预处理是如何实现的

人工智能 2024年1月5日
0043
python——stack()和unstack（）用法

在python里面，有时候要对数据进行数据处理，有次在处理过程中，发现了这两个函数，stack（）和unstack（）函数，那么这两个函数究竟是什么意思呢？我们先看代码。 1.首先…

人工智能 2023年7月7日
0061
Python 音频处理：wave

wave 模块提供了一个处理 WAV 声音格式的便利接口。它不支持压缩/解压，但是支持单声道/立体声。用法： wave.open(file, mode=None)，其中， m…

人工智能 2023年5月27日
0061
Masked Feature Prediction for Self-Supervised Visual Pre-Training

Masked Feature Prediction for Self-Supervised Visual Pre-Training * – 0.背景 – 1…

人工智能 2023年5月31日
0087
使用Python对拉勾网站的职位分析

目录分析目的数据获取及清洗过程 1.拉勾网站的网页数据获取 2.获取的网页数据存储以及清洗过程职位信息可视化 1. 绘制北京，上海，深圳三大城市职位个数的区县图 2.绘制数据…

人工智能 2023年7月16日
0065
sklearn综合示例5：多分类分类器

二元分类器在两个类中区分，而多类分类器（也称为多项分类器）可以区分两个以上的类。有一些算法（如随机森林分类器或朴素贝叶斯分类器）可以直接处理多个类。也有一些严格的二元分类器（如支持…

人工智能 2023年7月1日
0059

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31