PyTorch中的自动微分是什么？它有什么作用

2024年1月2日下午6:44 • 人工智能 • 阅读 24

问题：PyTorch中的自动微分是什么？它有什么作用？

详细介绍

在深度学习中，反向传播算法是一个关键的概念，用于计算神经网络中各个参数对损失函数的偏导数。PyTorch是一个基于Torch的深度学习框架，它提供了自动微分功能，使得我们可以很方便地计算出反向传播所需的梯度信息。

自动微分（Automatic Differentiation）实际上是包括正向传播和反向传播两个步骤。正向传播用于计算损失函数的值，反向传播用于计算每个参数对损失函数的偏导数。

PyTorch中的自动微分主要通过torch.Tensor类及其后台的torch.autograd模块来实现。

算法原理

以单个标量函数为例，算法原理如下所示：

首先，我们定义需要求导的张量（一般为模型参数），设置requires_grad=True属性，以便PyTorch跟踪它们的操作历史和计算梯度。
使用张量执行一系列计算，构建计算图。
定义损失函数，并通过正向传播计算出损失值。
调用backward()方法执行自动微分。该方法会自动计算损失函数对所有requires_grad=True的张量的梯度。
梯度信息保存在各个张量的.grad属性中。

公式推导

假设我们有一个函数$f(x)$，其中$x$是一个张量变量。我们想要计算$f(x)$关于$x$的导数，即$\frac{\partial f(x)}{\partial x}$。

根据链式法则，我们可以将导数表示为：

$$\frac{\partial f(x)}{\partial x} = \frac{\partial f(x)}{\partial u} \cdot \frac{\partial u}{\partial x}$$

其中$u$是通过对$x$的操作得到的中间变量。对于每个操作，我们需要记录操作类型以及相应的导数规则。

计算步骤

下面我们将通过一个具体的例子来演示PyTorch中的自动微分过程。

import torch

# 创建需要求导的张量x
x = torch.tensor(2.0, requires_grad=True)

# 定义一个函数 f(x) = x^3 + 2x^2 - 5
def f(x):
 return x artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 3 + 2 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls x artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 2 - 5

# 计算函数值
y = f(x)

# 执行自动微分
y.backward()

# 输出求导结果
print(x.grad)

运行以上代码，我们会得到输出结果为 29.0，即$x=2$时，$f(x)$ 关于 $x$ 的导数为 29.0。

代码解释

该代码首先使用torch.tensor创建了一个需要求导的张量x，并设置requires_grad=True属性以告知PyTorch需要跟踪它的操作历史和计算梯度。

接着，我们定义了一个函数f，用于计算$f(x)$的值。

然后，我们通过执行y = f(x)计算出$f(x)$的值，并将结果保存在变量y中。

接着，我们调用y.backward()方法执行自动微分。在该步骤中，PyTorch使用反向传播算法计算出x.grad中的梯度信息。

最后，我们通过访问x.grad属性即可获得$f(x)$关于$x$的导数值。

需要注意的是，自动微分只能计算标量函数关于张量的导数。如果我们要计算矢量函数的导数，需要对各个元素分别进行自动微分。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823251/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

公司对外投资和担保

一、公司对外投资和担保规范公司对外投资和外他人提供担保，需承担相应的责任公司可以对外投资和提供担保二、公司提供担保的方式保证抵押质押三、公司提供担保的规定公司对外承…

人工智能 2023年7月31日
0064
Collaborativ

介绍 Collaborative Filtering（协同过滤）是一种常用的推荐系统算法，其基本思想是利用用户对物品的偏好信息来预测用户对未知物品的喜好程度。在本文中，我们将详细介…

人工智能 2024年1月2日
0043
python学习笔记（23）jieba库的使用

文章目录 * – 简介 – jieba库解析简介 jieba库是python中重要的第三方中文词语分割函数库。对于英文字符串来说，提取其中的单词只需要使用…

人工智能 2023年5月28日
00108
python创建两列n行的表格_Python Pandas：基于两列在dataFrame中创建新行

您可以使用：#remove ‘, split by +, create Series s1 = df.Products.str.strip(“‘…

人工智能 2023年7月8日
0084
Pytorch二元交叉熵损失函数种类及接口

之前学了很久的Tensorflow，最近也在研究Pytorch，对损失函数的部分做以下的总结。本文只介绍二分类的二元交叉熵损失。这里不考虑batchsize的情况。只聚焦于公式本身…

人工智能 2023年5月26日
0070
模拟退火算法介绍和实例实现

一、模拟退火算法简介模拟退火算法(SA)来源于固体退火原理，是一种基于概率的算法。将固体加温至充分高的温度，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，分子和原…

人工智能 2023年7月28日
0060
Layer中的参数是什么

关于Layer中的参数是什么在深度学习中，Layer（层）是神经网络的基本组成单位。每个层都有一些可调的参数，这些参数用来构建网络并对数据进行转换。了解这些参数的作用和含义对理解…

人工智能 2024年1月6日
0049
音频处理——音频处理的基本概念

目录声音的本质声音的物理性质 * 波形频率一个例子数字音频 * 采样率采样量化（采样精度、采样深度）音频帧常见名词解释 * 举例声音的本质声音是由物体的振动引起…

人工智能 2023年5月25日
0074
基于Python实现五大常用分类算法(原理+代码)

读：在机器学习和统计中，分类算法通过对已知类别训练集的计算和分析，从中发现类别规则并预测新数据的类别。分类被认为是监督学习的一个实例，即学习可以获得正确识别的观察的训练集的情况。…

人工智能 2023年6月24日
0078
【图像处理】高斯模糊、高斯函数、高斯核、高斯卷积操作

通常，图像处理软件会提供”模糊”（blur）滤镜，使图片产生模糊的效果。 “模糊”的算法有很多种，其中有一种叫做”高斯模…

人工智能 2023年5月26日
00176
【多元统计分析】均值向量和协方差阵的检验——spss上机实验

均值向量和协方差阵的检验——spss上机实验参考书目为《多元统计分析》（第五版）——何晓群.中国人民大学出版社如有错误，请指正！谢谢~ 关注公众号搜索同名文章获取数据~ 习题2…

人工智能 2023年7月14日
00191
【Pytorch神经网络实战案例】20基于Cora数据集实现图卷积神经网络论文分类

1 案例说明（图卷积神经网络） CORA数据集里面含有每一篇论文的关键词以及分类信息，同时还有论文间互相引用的信息。搭建AI模型，对数据集中的论文信息进行分析，根据已有论文的分类特…

人工智能 2023年7月24日
0072
特征选择是指从原始特征集合中选择最有用的特征来构建回归模型。常见的特征选择方法包括过滤法、包装法和嵌入法

特征选择特征选择是指从原始特征集合中选择最有用的特征来构建回归模型。在机器学习和数据挖掘任务中，特征选择是一个重要的步骤。它通过减少特征空间的维度，提高模型的泛化能力和预测性能，…

人工智能 2023年12月31日
0046
Tensorflow On Spark (2021版)

之前网上的版本太老了，mnist_spark.py和mnist_data_setup.py测试文件的参数和位置，以及tensorflow-hadoop的版本(1.5)都更新了一、…

人工智能 2023年5月25日
0075
矩阵相似性度量

1、计算矩阵的相似性的任务就是找到一个度量，量化矩阵相似程度 1.1将矩阵展开成一维向量，计算两向量的乘积再除以他们的模长。 def mtx_similar1(arr1:np.nd…

人工智能 2023年7月5日
00101
box-shadow 和 outline 的多重边框之旅

利用box-shadow和outline设置多重边框一、结论 box-shadow 和 outline 都不占据空间，border 占据空间。 box-shadow 可以设置多重…

人工智能 2023年6月4日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31