PyTorch深度学习实践——反向传播

2023年6月4日上午1:00 • 人工智能 • 阅读 111

反向传播

课程来源：PyTorch深度学习实践——河北工业大学

《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibili

反向传播
笔记
作业

笔记

在之前课程中介绍的线性模型就是一个最简单的神经网络的结构，其内部参数的更新过程如下：

对于简单的模型来说可以直接使用表达式的方式来更新权重，但是如果网络结构比较复杂（如下图），直接使用解析式的方式来更新显然有些复杂且不太可能实现。

反向传播就是为了解决这种问题。反向传播的基本思想就是将网络看成一张图，在图上传播梯度，从而使用链式传播来计算梯度。首先介绍两层的网络的计算图的方式表示如下图所示：

矩阵求导参考书籍链接如下：https://bicmr.pku.edu.cn/~wenzw/bigdata/matrix-cook-book.pdf

如果把式子展开，将会有如下结果：

也就是多层线性模型的叠加是可以用一个线性模型来实现的。因此为了提高模型的复杂程度，对于每一层的输出增加一个非线性的变化函数，如sigmoid等函数，如下图所示：

反向传播的链式求导的过程一个实例如下图所示：

得到相应导数之后就可以对于权重进行更新，如果x也只是一个中间结果，则可以继续向前传导。

接下来可以看一个完整的线性模型的计算图示例，过程就是先进行前馈过程，在前馈到loss之后进行反向传播，从而完成计算：

接下来介绍在PyTorch中如何进行前馈和反馈计算。

首先需要介绍的是Tensor，这是PyTorch中构建动态图的一个重要组成部分，Tensor中主要元素的是Data（数据）和Grad（导数），分别用于保存权重值和损失函数对权重的导数。

使用PyTorch实现上述的线性模型的代码如下：

import torch
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

w = torch.tensor([1.0]) #初值为1.0
w.requires_grad = True # 需要计算梯度

def forward(x):
    return x*w  # 返回tensor

def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y)**2

print("predict (before training)", 4, forward(4).item())

for epoch in range(100):
    for x, y in zip(x_data, y_data):
        l =loss(x,y) #l是一个张量
        l.backward() #将计算链路上需要梯度的地方计算出梯度，这一步之后计算图释放，每一次更新都创建新的计算图
        print('\tgrad:', x, y, w.grad.item())#item是为了把梯度中的数值取出为标量
        w.data = w.data - 0.01 * w.grad.data   # 权重更新时，使用标量，使用data的时候不会建立新的计算图，注意grad也是一个tensor
        w.grad.data.zero_() # 更新之后将梯度数据清零
    print('progress:', epoch, l.item())
print("predict (after training)", 4, forward(4).item())

作业

1、手动推导线性模型y=w*x，损失函数loss=(ŷ-y)²下，当数据集x=2,y=4的时候，反向传播的过程。

2、手动推导线性模型 y=w*x+b，损失函数loss=(ŷ-y)²下，当数据集x=1,y=2的时候，反向传播的过程。

3、画出二次模型y=w1 _x²+w2_x+b，损失函数loss=(ŷ-y)²的计算图，并且手动推导反向传播的过程，最后用pytorch的代码实现。

代码如下：

import torch
import matplotlib.pyplot as plt
import numpy as np
x_data=[1.0,2.0,3.0]
y_data=[2.0,4.0,6.0]
w1=torch.tensor([1.0],requires_grad=True)
w2=torch.tensor([1.0],requires_grad=True)
b=torch.tensor([1.0],requires_grad=True)
epoch_list=[]
loss_list=[]
def forward(x):
    return w1*x**2+w2*x+b
def loss(x,y):
    y_pred=forward(x)
    return (y_pred-y)**2
print('Predict (befortraining)',4,forward(4))
for epoch in range(100):
    for x,y in zip(x_data,y_data):
        l=loss(x,y)
        l.backward()
        print('\tgrad:',x,y,w1.grad.item(),w2.grad.item(),b.grad.item())
        w1.data=w1.data-0.01*w1.grad.data
        w2.data = w2.data - 0.01 * w2.grad.data
        b.data = b.data - 0.01 * b.grad.data
        w1.grad.data.zero_()
        w2.grad.data.zero_()
        b.grad.data.zero_()
        print('Epoch:', epoch, l.item())
        epoch_list.append(epoch)
        loss_list.append(l.data)
print('Predict(after training)', 4, forward(4).item())
print('predict (after training)', 4, forward(4))
plt.plot(epoch_list, loss_list)
plt.ylabel('loss')
plt.xlabel('epoch')
plt.show()

可视化loss如下：

Original: https://www.cnblogs.com/Zhengsh123/p/15889625.html
Author: zsh1234
Title: PyTorch深度学习实践——反向传播

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/566058/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言实例：基于Boston数据集的数据分析报告——用 logistic 回归、LDA（线性判别法）、K 临近法（k=1 和 k=5）构建分类模型。目的是预测一个区域的犯罪率是否高于所有犯罪率的中位数

文章目录问题 Boston 数据集 * 查看数据集数据描述构建分类模型 * 数据可视化 logistic 分类模型 – 构建分类模型的因变量构建三个不同自变量的…

人工智能 2023年7月15日
00103
YOLOv5-v6.0学习笔记

YOLOv5-v6.0学习笔记 1. 网络结构 * 1.1 Backbone – 1.1.1 Conv模块 1.1.2 Focus模块 1.1.3 CSPDarkNet…

人工智能 2023年5月26日
00138
第三讲神经网络八股

神经网络八股 1、搭建神经网络八股sequential * 用TensorFlow API：tf.keras搭建网络八股 Sequential() compile() fit() …

人工智能 2023年7月14日
0085
Python之Series和DataFrame的数据排序

Series和DataFrame的数据排序文章目录 Series和DataFrame的数据排序 * 前言系列文章环境：jupyter Notebook(Anaconda) &…

人工智能 2023年7月7日
0064
通过矩阵化的卷积层理解上采样层

https://naokishibuya.medium.com/up-sampling-with-transposed-convolution-9ae4f2df52d0 If yo…

人工智能 2023年6月6日
00108
基于Tensorflow2的卷积神经网络MNIST手写数字识别

1. 导包 import numpy as np import tensorflow as tf import tensorflow.keras.datasets.mnist as…

人工智能 2023年7月1日
0087
CV16 人脸检测：Haar级联

文章目录 * – Haar级联简介 – + 什么是Haar？ + 什么是级联？ + 优劣对比 – 获取Haar级联数据 – 检测人脸…

人工智能 2023年7月20日
0065
如何使用PyTorch进行文本分类任务

问题背景文本分类是自然语言处理中的重要任务，它的目标是将文本分成不同的预定义类别。在本问题中，我们将介绍如何使用PyTorch进行文本分类任务。我们将通过一个具体的示例来说明整个…

人工智能 2024年1月2日
0046
软件配置部分——从无到有自主搭建视觉惯性VI-SLAM(vins-mono)平台

随着SLAM的发展，现有的开源方案越来越多，这位优秀博主的整理大家可以看看：116项开源视觉slam方案对于VI-SLAM，目前大家研究最多的应该是港科大沈老师团队提出的VINS…

人工智能 2023年6月11日
00114
机器学习_深度学习毕设题目汇总——语音

下面是该类的一些题目：题目基于文本/语音驱动的高自然度人脸动画生成深度学习语音识别系统中的自适应方法研究RNN-DNN语音识别系统研究及其应用发音特征在跨语言语音识别中的应用研究…

人工智能 2023年5月23日
0078
python中Pandas之DataFrame索引、选取数据

总结一下索引问题 1.1 认识索引先创建一个简单的 DataFrame。 myList = [[‘a’, 10, 1.1], [‘b’, 20, 2.2], [‘c’, 30,…

人工智能 2023年7月4日
0059
Pandas 学习第4篇：DataFrame -（创建、属性、操作列、类型转换）

DataFrame中面向行和面向列的操作基本上是相同的，把行和列称作轴（axis），DataFrame是按照轴进行操作的，axis=0表示行轴；axis=1 表示列轴。在操作Da…

人工智能 2023年6月2日
00102
小目标检测

小目标检测参考论文：地址小目标定义相对尺度定义从目标与图像的相对比对小目标进行定义。Chen等提出了一个针对小目标的数据集，对小目标进行定义：同一类别中，所有目标实例的相对…

人工智能 2023年6月16日
0093
图像处理–边缘检测《python基础篇》

3.Sobel算子（也挺重要的）在最初的Sobel算子，在MATLAB应用中是一个矩阵的形式，以此寻找图像的边缘信息，矩阵类似于这个样子： sobel0=np.array([[0…

人工智能 2023年6月20日
0093
开源 SPL 重新定义 OLAP Server

OLAP（Online Analytical Processing）是指在线联机分析，基于数据查询计算并实时获得返回结果。日常业务中的报表、数据查询、多维分析等一切需要即时返回结果…

人工智能 2023年7月18日
0071
解决tensorboard调用events.out.tfevents文件得到网址出现No dashboards are active for the current data set…的问题

一、关于生成网址的终端的选择我查阅了大量的博文，有的说用cmd命令窗口生成网址；有的说打开anaconda prompt，激活tensorflow环境然后操作生成网址。对于终端的选…

人工智能 2023年5月23日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

PyTorch深度学习实践——反向传播

笔记

作业

大家都在看