PyTorch中的自动微分是如何实现的

2024年1月2日上午11:54 • 人工智能 • 阅读 42

问题：PyTorch中的自动微分是如何实现的？

详细介绍：

PyTorch是一个基于Python的科学计算库，也是一个用于构建深度学习模型的工具包。它提供了自动微分的功能，使得对于复杂的深度学习模型进行梯度计算变得非常简便。PyTorch中的自动微分是通过计算图和反向传播算法来实现的。

算法原理：

自动微分是计算导数（梯度）的一种方法，它通过构建计算图、计算前向传播并在后向传播中计算梯度来实现。在PyTorch中，计算图是由一系列的节点（Node）和边（Edge）构成的有向无环图。节点表示操作或函数，边表示数据流动的方向。

在计算图中，我们可以将输入数据视为叶子节点，通过执行一系列的操作（例如加法、乘法、激活函数等）来生成输出。在此过程中，PyTorch会自动跟踪所有操作，并构建一个动态计算图。

在前向传播中，将输入数据流经计算图中的各个节点，逐步计算输出。同时，PyTorch还在每个节点上维护了关于输入和输出的梯度信息。

在反向传播过程中，PyTorch会根据链式法则自动计算每个节点上的梯度。具体来说，PyTorch会从输出节点开始，通过递归地应用链式法则计算每个节点的梯度，最终得到每个节点的梯度值。

公式推导：

假设我们有一个简单的计算图，其中有两个节点$x$和$y$，它们通过一个中间节点$z$相连。我们将$x$和$y$的梯度分别记为$\frac{\partial L}{\partial x}$和$\frac{\partial L}{\partial y}$，其中$L$表示损失函数。根据链式法则，我们可以得到：
$$\frac{\partial L}{\partial x} = \frac{\partial L}{\partial z} \cdot \frac{\partial z}{\partial x}$$
$$\frac{\partial L}{\partial y} = \frac{\partial L}{\partial z} \cdot \frac{\partial z}{\partial y}$$

计算步骤：

定义输入张量和模型参数。
构建计算图，通过执行各种操作来生成输出。
根据计算图计算模型的输出并计算损失函数。
调用PyTorch提供的反向传播函数loss.backward()，自动计算每个节点的梯度。
更新模型参数。

复杂Python代码示例：

下面是一个简单的示例，展示了使用PyTorch进行自动微分的过程。假设我们有一个简单的线性回归模型，输入是一个二维张量X，输出是一个标量Y。我们使用平方损失函数计算模型的损失，并通过反向传播更新模型参数。

import torch

# 生成虚拟数据集
X = torch.tensor([[1.0, 2.0], [3.0, 4.0]])
Y = torch.tensor([[3.0], [7.0]])

# 定义模型参数
w = torch.tensor([[0.5], [0.5]], requires_grad=True) # 需要计算梯度
b = torch.tensor([1.0], requires_grad=True) # 需要计算梯度

# 构建计算图
Y_pred = torch.matmul(X, w) + b
loss = torch.mean((Y_pred - Y) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 2)

# 反向传播
loss.backward()

# 更新模型参数
with torch.no_grad(): # 关闭梯度计算，避免更新参数时计算梯度
 w -= 0.01 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls w.grad
 b -= 0.01 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls b.grad

 # 清除梯度
 w.grad.zero_()
 b.grad.zero_()

在这个示例中，我们首先生成虚拟的输入数据集X和输出数据集Y。然后，我们定义模型参数w和b，并将它们设置为需要计算梯度（requires_grad=True）。

接下来，我们构建计算图，通过矩阵乘法和加法操作计算模型的输出。然后，我们使用平方损失函数计算模型的损失。

调用loss.backward()函数可以启动反向传播过程，PyTorch会自动计算每个节点的梯度。

最后，我们使用梯度下降法更新模型参数w和b，并清除梯度以便下一次迭代。

代码细节解释：

requires_grad=True：对于需要计算梯度的张量，我们需要将其requires_grad属性设置为True。这样PyTorch会自动跟踪其梯度信息。
loss.backward()：调用此函数会自动计算损失关于每个节点梯度。这类似于首次计算损失关于每个参数的偏导数，然后逐级应用链式法则。
torch.no_grad()：在更新模型参数时，我们使用该上下文管理器关闭梯度计算。这样可以避免在更新参数时计算梯度，从而提高运行效率。
grad.zero_()：在更新模型参数之前，我们需要手动将梯度清零。这是因为PyTorch会在进行反向传播时累积梯度，并且默认不会清除之前的梯度。

这个示例只是一个简单的使用PyTorch进行自动微分的例子。在实际应用中，计算图可能更加复杂，模型参数和操作也会更加复杂。但是PyTorch的自动微分机制可以大大简化梯度计算的过程，提高深度学习模型的开发效率。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823177/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CSP CCF： 202109-3 脉冲神经网络（C++） 66分

由于我有些看不懂这个题目，所以我是先找的他人的博客理解了一下题目。所以我这里主要就是记录一下这道题啦，想到如何优化到100分，再更新。 66分 #include #include…

人工智能 2023年7月13日
0043
基于边缘修复的图像分割论文简读

文章目录 2016 * DCAN: Deep Contour-Aware Networks for Accurate Gland Segmentation 2018 * Multi…

人工智能 2023年5月28日
0092
Python二手房价格预测（三）——二手房价格预测模型baseline

系列文章目录一、Python二手房价格预测（一）——数据获取二、Python二手房价格预测（二）——数据处理及数据可视化文章目录系列文章目录前言一、数据处理二、模型训…

人工智能 2023年6月16日
00116
Convolution）是什么？有什么作用

Convolution是什么？ Convolution是一种数学运算，常用于信号处理和图像处理领域。它基于一种局部性的假设，认为输出的每个元素仅与输入的相邻元素有关。在图像处理中…

人工智能 2024年1月1日
0028
深度学习之目标检测（十一）–DETR详解

深度学习之目标检测（十一）– DETR详解目录 * – 深度学习之目标检测（十一）– DETR详解 – + 1. 前言 + 2. …

人工智能 2023年7月23日
0061
全球与中国滑雪头盔行业市场调研及投资风险展望报告2022-2028年

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月15日
0053
【毕业设计】LSTM天气预测系统（时间序列预测）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月15日
0060
深度学习——回归问题

深度学习——回归问题文章目录深度学习——回归问题线性回归 * 一、什么是线性回归？ – 梯度下降学习率二、逻辑回归线性回归一、什么是线性回归？其中w是权…

人工智能 2023年6月17日
0090
【大数据】美国新冠肺炎疫情分析——错误版（QDU）

这个版本有些错误，整体思路上的错误，正确的版本中会直接使用该错误版本中的一些细节思路，所以还是建议先理解该错误版本，再看正确版本（其实是当时老师觉得我们做的太拉了，所以让我们重做，…

人工智能 2023年7月17日
0066
人工智能画画 yyds

最近 AI 绘画火的一塌糊涂，你输一句话 AI 自动把你描述的场景画出来。本文盘点 GitHub 上几个较火的 AI 绘画开源项目。本期推荐开源项目目录： Latent Diff…

人工智能 2023年6月26日
0057
RK3399Pro-硬件编解码器MPP库快速上手–（三）MPP编码关键代码讲解

为了方便配置功能，我们一般将Mpp配置的关键参数定义为结构体: struct MPP_ENC_DATA { uint32_t frm_eos; uint32_t pkt_eos; …

人工智能 2023年6月20日
00102
SPSS：主成分分析确定不同指标权重

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量，同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息，也是数学上处理降维的一种统计学…

人工智能 2023年7月14日
0060
大象声科在联想YOGA Pro 14s的方案概要和 intel GAN初见

在联想联想高阶旗舰品牌YOGA Pro 14s (YOGA Slim 9i)上搭载了大象声科Vocplus PC AI语音方案，据该方案这是一套集成在Intel GNA人工智慧加…

人工智能 2023年5月27日
00136
基于pytorch平台实现对MNIST数据集的分类分析（前馈神经网络、softmax）基础版

基于pytorch平台实现对MNIST数据集的分类分析（前馈神经网络、softmax）基础版文章目录基于pytorch平台实现对MNIST数据集的分类分析（前馈神经网络、sof…

人工智能 2023年7月23日
0052
【微信小程序系列：四】前端利用wx.setStorageSync缓存设置有效时间

先言：简单来说，就是利用缓存，进行有效期的保存，以此前端加以判断，在如登录状态过期，操作过期等场景使用，扩展性还蛮多的。官方文档实现：原理：就是先设置一个缓存，这个缓存值为…

人工智能 2023年6月28日
0074
DQN（deep Q-network）算法简述

本文通过整理李宏毅老师的机器学习教程的内容，简要介绍深度强化学习（deep reinforcement learning）中的 DQN（deep Q-network）算法。李宏毅…

人工智能 2023年6月16日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31