grad can be implicitly created only for scalar outputs

2023年6月17日上午3:59 • 人工智能 • 阅读 69

1.Autograd：自动求导

torch.Tensor 是这个包的核心类。如果设置它的属性 .requires_grad 为 True，那么它将会追踪对于该张量的所有操作。当完成计算后可以通过调用 .backward()，来自动计算所有的梯度。这个张量的所有梯度将会自动累加到 .grad属性.

要阻止一个张量被跟踪历史，可以调用 .detach() 方法将其与计算历史分离，并阻止它未来的计算记录被跟踪。

为了防止跟踪历史记录(和使用内存），可以将代码块包装在 with torch.no_grad(): 中。在评估模型时特别有用，因为模型可能具有 requires_grad = True 的可训练的参数，但是我们不需要在此过程中对他们进行梯度计算。

还有一个类对于autograd的实现非常重要： Function。

Tensor 和 Function 互相连接生成了一个无圈图(acyclic graph)，它编码了完整的计算历史。每个张量都有一个 .grad_fn 属性，该属性引用了创建 Tensor 自身的 Function(除非这个张量是用户手动创建的，即这个张量的 grad_fn 是 None )。

如果需要计算导数，可以在 Tensor 上调用 .backward() 。如果 Tensor 是一个标量(即它包含一个元素的数据），则不需要为 backward() 指定任何参数，但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

1.1 grad can be implicitly created only for scalar outputs

根据文档如果 Tensor 是一个标量(即它包含一个元素的数据），则不需要为 backward() 指定任何参数，但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

所以当：

x = torch.ones(2,requires_grad=True)
print(x)
z = x + 2
print(z)
z.backward()
print(x.grad)

RuntimeError: grad can be implicitly created only for scalar outputs

即：

grad can be implicitly created only for scalar outputs

那么我们只要想办法把矩阵转变成一个标量不就好了？比如我们可以对z求和，然后用求和得到的标量在对x求导，这样不会对结果有影响，例如：

我们可以看到对z求和后再计算梯度没有报错，结果也与预期一样：

x = torch.ones(2,requires_grad=True)
z = x + 2
z.sum().backward()
print(x.grad)

>>> tensor([1., 1.])

再回到文档 但是如果它有更多的元素，则需要指定一个 gradient 参数，该参数是形状匹配的张量。

也就是对于矩阵求导来说，需要一个额外的参数矩阵和需要求导的矩阵做点乘。一般点乘的矩为全1的对应形状的矩阵。也就是乘以全1的矩阵，等价于sum().

参考 Pytorch autograd, backward详解

也就是比如

x = torch.tensor([2., 1.], requires_grad=True)
y = torch.tensor([[1., 2.], [3., 4.]], requires_grad=True)

z = torch.mm(x.view(1, 2), y)
print(f"z:{z}")
z.backward(torch.Tensor([[1., 0]]), retain_graph=True)
print(f"x.grad: {x.grad}")
print(f"y.grad: {y.grad}")

>>> z:tensor([[5., 8.]], grad_fn=<MmBackward>)
x.grad: tensor([[1., 3.]])
y.grad: tensor([[2., 0.],
        [1., 0.]])

结果解释如下：

这里并没使用全为1的矩阵，因此grad_tensors 如果自定义，会产生对应自定义产生的结果。一般来说都定义为全1的矩阵。（可以看作等价与sum())

Original: https://blog.csdn.net/qq_39208832/article/details/117415229
Author: 一只皮皮虾x
Title: grad can be implicitly created only for scalar outputs

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628357/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python爬虫数据分析浅尝试(爬取同学的网站)

目录前言：声明：结果展示：用到的库：初始化：代码部分及解释：具体实现： 1.导入/更新： 2.爬虫： 3.词频统计： 4.词云绘制：鸣谢：前言：声明：首先，一…

人工智能 2023年6月11日
0076
软件测试面试真题 | 什么是PO设计模式？

面试官问：UI自动化测试中有使用过设计模式吗？了解什么是PO设计模式吗？考察点《page object 设计模式》：PageObject设计模式的设计思想、设计原则《web自动…

人工智能 2023年6月29日
0097
【Python爬虫】2022年数学建模美赛B题数据爬取

2022年数学建模美赛B题数据爬取背景 2022年的美赛刚刚落下帷幕，该题的一个主要难点在于数据的获取。很多人无法找到有效的数据，或者是无法获取数据。比如找到了如下米德湖的水文…

人工智能 2023年7月16日
0071
(一)路径规划算法—Astar实现自定义的全局路径规划插件

Astar实现自定义的全局路径规划插件文章目录 Astar实现自定义的全局路径规划插件 * 1.插件功能包的建立 2. 相关步骤 – 2.1 建立工作空间和环境变量的…

人工智能 2023年6月1日
0077
HTML5期末大作业：HTML+CSS茶叶官网网页设计实例企业网站制作

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月26日
0095
在anaconda配置pytorch环境

简单记录一下在anaconda配置pytorch的步骤。如果电脑有可用cuda的GPU，就要首先准备cuda。访问pytorch官网，查看可用的cuda版本。例如目前可适配的cu…

人工智能 2023年7月22日
0064
如何在线文字转语音？

截止2020年12月，我国短视频用户达到了8.73亿，占整体网民的88.3%。由于门槛低、传播性广更容易受到用户接受。随着用户量增加，越来越多的创作者内容也从图文转向短视频创作。 …

人工智能 2023年5月25日
0066
如何理解基于深度学习的点云补全算法 – PF-Net (Point Fractal Network for 3D Point Cloud Completion) ?

CV_6 PF-Net 算法解析一. 引言了解激光雷达- LiDAR 特性的同学们都知道，LiDAR有一个致命的缺陷，那就是随着被检测物体的距离越来越远，根据LiDAR获取的点…

人工智能 2023年5月26日
0086
python 使用前馈神经网络处理IrIs数据集（BP）

本文章包含以下内容：数据: lris数据集; 模型: 前馈神经网络; 激活函数: Logistic 损失函数: 交叉嫡损失; 优化器: 梯度下降法; 评价指标 :准确率。输出层…

人工智能 2023年7月28日
0054
5个必知必会的 Python 数据合并技巧

大家好，前不久在我们技术交流群有群友提到最近他面试阿里70万总包的数据岗位，对方问 Pandas的 5种数据合并的函数，结果他只答出了 2个。那么，究竟是哪五个呢？今天，我们…

人工智能 2023年7月7日
0080
LSTM分类模型

LSTM文本分类模型本文主要固定一个文本分类的流程。分为三个部分：数据处理。对分类文本数据集做简单的预处理。模型数据准备。处理上一步的结果，得到模型的输入样本。模型搭建和训…

人工智能 2023年6月23日
00121
你不得不了解的语义分割发展史

一些废话：好久没写综述之类的文章，本文的发展史是基于去年和前年读的语义分割的论文，在去年的时候写的。毕业之际将自己手头有的资料分享出来。话不多说开始学习！！！前言：你不得不了解…

人工智能 2023年7月13日
0062
BraTs数据集处理及python读取.nii文件

导师让做一个关于脑肿瘤分割的小项目，今天开始学习图像分割和MRI相关知识！（md从分类到检测再到分割，从遥感图到脑部图，我真的会谢…生气）数据集 BraTS 是MIC…

人工智能 2023年5月26日
0065
易基因 | 文献速递：全面的表观基因组图谱揭示了DNA甲基化调节骨骼肌发育的机制

大家好，易基因文献科普栏目又来啦！今天要分享解读一篇发表于Nucleic Acids Research（IF16.971）的DNA甲基化研究文章，本文通过WGBS-seq和RNA-…

人工智能 2023年6月10日
0097
迁移学习-李沐

迁移学习 1、迁移学习1.1、迁移学习目的能在一个任务上学习一个模型，然后用其来解决相关的别的任务，这样我们在一个地方花的时间，学习的一些知识，研究的一些看法可以在另外一个地方被…

人工智能 2023年6月17日
0086
cv2.VideoWriter 保存图像为视频的几个问题

用opencv库的cv2.VideoWriter函数保存图像为视频一、先确定要保存的视频的编码方式 cv2.VideoWriter_fourcc(‘I’,…

人工智能 2023年7月20日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

grad can be implicitly created only for scalar outputs

1.1 grad can be implicitly created only for scalar outputs

大家都在看