【PyTorch深度学习实践】深度学习之反向传播，用PyTorch实现线性回归和Logistic回归

2023年6月18日下午2:55 • 人工智能 • 阅读 121

文章目录

前言
一、反向传播
二、用PyTorch实现线性回归
三、Logistic回归
总结

前言

继上一节讲的线性模型和梯度下降法后，本节将在此基础上讲解反向传播，用PyTorch实现线性回归和Logistics回归

一、反向传播

误差反向传播法（Back-propagation,BP）会计算神经网络中损失函数对各参数的梯度，配合 优化方法更新参数，降低损失函数。
BP本来只指损失函数对参数的梯度通过网络反向流动的过程，但现在也常被理解成神经网络整个的训练方法，由 误差传播、 参数更新两个环节循环迭代组成。

【PyTorch深度学习实践】深度学习之反向传播，用PyTorch实现线性回归和Logistic回归

依旧是选择上一篇文章讲的线性模型来讲解反向传播法，如上图所示，从左向右看，在构建线性模型y=wx并且求损失函数的过程中，我们可以得到中间这些变量对x和w的导数。而经过反向传播后，也就是从右向左看，反向传播法是能够自动求出损失函数对各参数的梯度的。那么对于上一节讲的线性模型，我们的目的是为了找到一个合适的权重w，所用的方法是损失函数对权重w求梯度，这不正好与咱们这一节所要讲的反向传播相对应了吗

反向传播的过程比较简单，以这个线性模型为例， 先定义好线性模型和损失函数，在计算完损失值后进行反向传播(backward)，并更新权重w即可，代码如下：

import torch

x_data=[1.0,2.0,3.0]
y_data=[2.0,4.0,6.0]

w=torch.Tensor([1.0])
w.requires_grad=True

def forward(x):
    return w*x

def loss(x,y):
    y_pred=forward(x)
    return (y_pred-y)**2

print("predict(before training)",4,forward(4).item())

for epoch in range(100):
    for x,y in zip(x_data,y_data):
        l=loss(x,y)              #计算损失值
        l.backward()             #反向传播
        print('\tgrad',x,y,w.grad.item())
        w.data=w.data-0.01*w.grad.data      #更新权重w

        w.grad.data.zero_()              #将第一轮反向传播后的权重w清零，不能影响下一轮反向传播的权重w

    print("progress:",epoch,l.item())

print("predict(after training)",4,forward(4).item())

大概训练20次左右，损失值便很小了

二、用PyTorch实现线性回归

用PyTorch实现线性回归，就是用PyTorch里面的模块来实现我们之前讲述的线性模型。PyTorch的模式比较一致，大致有四步构成：
1.准备数据集
2.设计模型
3.构建损失函数和优化器
4.训练（前馈，反向传播，更新参数）
如下图所示：

代码如下：

import torch

#准备数据集
x_data=torch.Tensor([[1.0],[2.0],[3.0]])   #3行1列的矩阵
y_data=torch.Tensor([[2.0],[4.0],[6.0]])

#设计模型
class LinearModel(torch.nn.Module):       #定义线性模型，继承自Module
    def __init__(self):
        super(LinearModel,self).__init__()   #初始化，调用父类的构造
        self.linear=torch.nn.Linear(1,1)     #线性函数Linear,包含两个参数，权重w和偏置b

    def forward(self,x):
        y_pred=self.linear(x)         #设计线性模型
        return y_pred

model=LinearModel()

#构造损失函数和优化器
criterion=torch.nn.MSELoss(size_average=False)    #损失函数MSE
optimizer=torch.optim.SGD(model.parameters(),lr=0.01)    #优化器，随机梯度下降SGD

#训练
for epoch in range(1000):           #训练1000次,100次效果不太好
    y_pred=model(x_data)
    loss=criterion(y_pred,y_data)
    print(epoch,loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

print('w=',model.linear.weight.item())
print('b=',model.linear.bias.item())

x_test=torch.Tensor([[4.0]])
y_test=model(x_test)
print('y_pred=',y_test.data)

三、Logistic回归

Logistic回归与线性回归不同，它解决的是一个 分类问题，它的输出结果是离散的，输出的是各个分类对象的概率

例如：识别手写数字集，这是一个分类问题，共分成0~9十个分类，用逻辑回归做输出结果是离散的，通过概率来识别数字

下面的动物识别也是一个分类问题，同上面的类似

在二分类问题中，只有0和1两类，输出结果是0或者1出现的概率

既然要表示概率，概率的取值是0~1的，那我们应该选择一个取值在0到1的函数来处理输出值， sigmoid函数就非常适合完成这项工作
—————————————————————————————————

sigmoid函数：

由函数图像可知，sigmoid函数有几个很好的性质：

当z趋近于正无穷大时，σ(z) = 1
当z趋近于负无穷大时，σ(z) = 0
当z = 0时，σ(z) = 0.5

将经过线性变化的值放入 sigmoid函数中处理，这样结果就在0~1之间了

与 线性回归的MSE损失函数不同的是，二分类问题的损失函数如下图所示，y代表分类是0还是1的概率。

总的来说，逻辑回归与线性回归主要有两处不同：
一：逻辑回归的中间值经过了sigmoid函数的处理
二：两种模型的损失函数不同
逻辑回归的代码如下：

import torch
import torch.nn.functional as F

#准备数据集
x_data=torch.Tensor([[1.0],[2.0],[3.0]])
y_data=torch.Tensor([[0],[0],[1]])

#设计模型
class LogisticRegressionModel(torch.nn.Module):
    def __init__(self):
        super(LogisticRegressionModel,self).__init__()
        self.liner=torch.nn.Linear(1,1)

    def forward(self,x):
        y_pred=F.sigmoid(self.liner(x))    #线性函数经过sigmoid函数处理
        return y_pred

model=LogisticRegressionModel()

#构造损失函数和优化器
criterion=torch.nn.BCELoss(size_average=False)      #逻辑回归的损失函数BCE
optimizer=torch.optim.SGD(model.parameters(),lr=0.01)

#训练
for epoch in range(1000):
    y_pred=model(x_data)
    loss=criterion(y_pred,y_data)      #计算损失值
    print(epoch,loss.item())

    optimizer.zero_grad()           #优化器清零
    loss.backward()                 #反向传播
    optimizer.step()                #更新

import numpy as np
import matplotlib.pyplot as plt

x=np.linspace(0,10,200)
x_t=torch.Tensor(x).view((200,1))
y_t=model(x_t)
y=y_t.data.numpy()
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()

总结

本文主要讲述了反向传播的作用，以及用PyTorch实现线性回归和逻辑回归的过程，比较了这两种模型的不同之处。最后大家需要重点牢记的就是那四个步骤，准备数据集，设计模型，构建损失函数和优化器，训练（前馈，反向传播，更新参数）。

Original: https://blog.csdn.net/qq_56550595/article/details/125690165
Author: 今天又干了些什么呢
Title: 【PyTorch深度学习实践】深度学习之反向传播，用PyTorch实现线性回归和Logistic回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635540/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[ 可视化 ] 经典网络模型 —— Grad-CAM 详解与复现

🤵 Author ：Horizon Max ✨ 编程技巧篇：各种操作小结 🎇 机器视觉篇：会变魔术 OpenCV 💥 深度学习篇：简单入门 PyTorch 🏆 神经网络篇：经典网络…

人工智能 2023年6月24日
00107
YOLOv5目标检测（数据集的训练及预测）

一、模型训练 1.配置环境 2.YOLOv5项目克隆（Github官网） 3.项目依赖的安装 pip install -r requirements.txt pip install…

人工智能 2023年7月9日
00112
读论文《Multi-Behavior Hypergraph-Enhanced Transformer for Sequential Recommendation》

0 Summary: Title: Multi-Behavior Hypergraph-Enhanced Transformer for Sequential Recommenda…

人工智能 2023年6月1日
0081
PS新手淘宝美工常见问题-主图和详情尺寸（一）

最近班上刚刚来个美工，正好坐我边上，平时有问题我们会一起交流，我就把她今天遇到的文件尺寸问题分享下哈淘宝主图尺寸，主图尺寸的话分为两种，方图和竖图 2. 竖图：尺寸比例为3:4，…

人工智能 2023年6月28日
0087
深度学习算法工程师面试知识点总结（四）

这是算法工程师面试知识点总结的第四篇，有兴趣的朋友可以看看前三篇的内容：深度学习算法工程师面试知识点总结（一）深度学习算法工程师面试知识点总结（二）深度学习算法工程师面试知识点总结…

人工智能 2023年5月26日
00133
FL(Focal Loss) & RetinaNet 学习笔记

FL & RetinaNet 学习笔记 Abstract & Introduction Focal loss * · Balanced Cross Entropy …

人工智能 2023年7月9日
0058
搭建免费代理IP池

👨‍💻博客主页：i新木优子👀🎉欢迎关注🔍点赞👍收藏⭐留言📝🧚‍♂️寄语:成功的秘诀就是每天都比别人多努力一点👣✨有任何疑问欢迎评论探讨 先&#x58F…

人工智能 2023年7月6日
0078
pandas使用str函数和contains函数删除dataframe中单个指定字符串数据列包含特定字符串列表中的其中任何一个字符串的数据行

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月7日
0058
pytorch之常用函数整理

pytorch之常用函数整理一、图像预处理函数 * 1.1 torchvision.datasets.ImageFolder()函数二、参数优化函数 * 2.1 torch.o…

人工智能 2023年7月21日
0058
求期望工期和某个时间点完成的概率(信息系统项目管理师教程)

正在开发一个设备管理功能，最快14天可以做完，正常20天做完，最慢32天可以做完。求期望工期和24天完成的概率是多少？从上面可以知道，最快14天完成，也就是最乐观时间为14。最可…

人工智能 2023年7月18日
0074
High-Resolution Network (篇一)：原理刨析

计算机视觉可以分为两类任务：图像分类、其他任务。对于图像分类任务而言，通常需要更加浓缩的语义信息，并不需要高分辨率的表征，只需要输出一个整体的标签即可。对于目标检测(区域级别分类…

人工智能 2023年5月28日
0071
Adam优化器（通俗理解）

网上关于Adam优化器的讲解有很多，但总是卡在某些部分，在此，我将部分难点解释进行了汇总。理解有误的地方还请指出。 Adam，名字来自： Adaptive Moment Estim…

人工智能 2023年6月22日
0092
如何让知识图谱辅助多轮对话

如何在对话中引入知识一直是备受关注的问题，这里的知识常常分为两类：非结构化知识结构化知识包括知识库、知识图谱、类别属性知识。在使用知识时，我们常常采用两种方式：生成式把…

人工智能 2023年6月1日
0068
Allergo导出Gerber文件

首先设置导出路径，点击 Setup->User Preferences，在弹出的对话框中设置 ads_sdart的值为 Gerber(名字随意)，该文件夹在当前.brd文件所…

人工智能 2023年6月27日
0065
ACL2022论文分类汇总-Prompt、句子表征、检索排序&摘要

写在前面大家好，我是刘聪NLP。 ACL2022会议的论文已经出来一阵子了，将论文列表过了一边，筛选了一些自己正在做或者感兴趣方向的相关论文，包括：Prompt（35篇）、句子表…

人工智能 2023年5月28日
00126
虚拟数字人市场现状研究分析-

辰宇信息咨询市场调研公司最近发布-《2022-2028中国虚拟数字人市场现状研究分析与发展前景预测报告》内容摘要本文研究中国市场虚拟数字人现状及未来发展趋势，侧重分析在中国市场…

人工智能 2023年7月17日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【PyTorch深度学习实践】深度学习之反向传播，用PyTorch实现线性回归和Logistic回归

文章目录

大家都在看