pytorch入门——构建神经网络

2023年7月12日下午7:40 • 人工智能 • 阅读 64

从 pytorch到nlp

第一章 pytorch 之构建神经网络

文章目录

从 pytorch到nlp
*
–
- 前言
一、构建神经网络的具体流程
二、代码及其解读
*
1.模型构建
2.查看模型参数
3.损失函数
4.反向传播
5.更新网络参数
总结

前言

 &#x4F5C;&#x4E3A;&#x4EBA;&#x5DE5;&#x667A;&#x80FD;&#x7684;&#x4E00;&#x9879;&#x91CD;&#x8981;&#x5206;&#x652F;&#xFF0C;&#x81EA;&#x7136;&#x8BED;&#x8A00;&#x5904;&#x7406;&#x5728;&#x5404;&#x4E2A;&#x9886;&#x57DF;&#x5F97;&#x5230;&#x4E86;&#x5E7F;&#x6CDB;&#x5E94;&#x7528;&#xFF0C;pytorch&#x662F;&#x5B66;&#x4E60;&#x81EA;&#x7136;&#x8BED;&#x8A00;&#x5904;&#x7406;&#x7684;&#x4E00;&#x4E2A;&#x6DF1;&#x5EA6;&#x5B66;&#x4E60;&#x6846;&#x67B6;&#x4E4B;&#x4E00;&#xFF0C;&#x672C;&#x6587;&#x8BB0;&#x5F55;&#x4E00;&#x4E0B;&#x5C0F;&#x675C;&#x7684;&#x5B66;&#x4E60;&#x7B14;&#x8BB0;

一、构建神经网络的具体流程

1 定义一个拥有可学习参数的神经网络
2 遍历训练数据集
3 处理数据使其流经神经网络
4计算损失
5将网络参数的梯度进行反向传播
6依一定的规则更新网络权重

二、代码及其解读

1.模型构建

代码是在jupyter notebook 上运行
图解

代码如下（示例）：

import torch
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
     #定义Net的初始化函数，这个函数定义了该神经网络的基本结构
    def __init__(self):
        super(Net,self).__init__()#对继承自父类的属性进行初始化 复制并使用Net的父类的初始化方法，即先运行nn.Module的初始化函数
        self.conv1=nn.Conv2d(1,6,3)#输入1 输出6 卷积核是3*3 表示提取6个特征，得到6个feature map
        self.conv2=nn.Conv2d(6,16,3)#输入6输出16
    #全连接层定义了三层线性转换，16*6*6就是把这16个二维数组拍扁了后一维向量的size
        self.fc1=nn.Linear(16*6*6,120)
        self.fc2=nn.Linear(120,84)
        self.fc3=nn.Linear(84,10)
        #Linear有三个参数，分别是输入特征数，输出特征数以及是否使用偏置（默认为True）。
        #默认情况下Linear会自动生成权重参数和偏置，所以在模型中不需要单独定义权重参数，
        #并且Linear提供比原先自定义权重参数时使用的randn随机正太分布更好的参数初始化方法
    def forward(self,x):
            x=F.max_pool2d(F.relu(self.conv1(x)),(2,2))#将x放入卷积层中 用激活函数relu激活  在2*2池化窗口进行最大池化
            x=F.max_pool2d(F.relu(self.conv2(x)),2)#经历第二个卷积层
            x=x.view(-1,self.num_flat_features(x))#通过这个view()函数我们把二维数据变成了一维向量。 Convolution Layer和Fully Connected Layer的对接
            x = F.relu(self.fc1(x))
            x = F.relu(self.fc2(x))
            x = self.fc3(x)
            return x
    def num_flat_features(self,x)##使用num_flat_features函数计算张量x的总特征量
        size=x.size[1:]
        num_features=1
        for s in size:
             num_features*=s #累乘
        return num_features
net=Net()
net

运行结果

这里显示了实例化类打印出来网络结构
这里我们的神经网络有五层两个卷积层三个全连接层

2.查看模型参数

params = list(net.parameters())
print(len(params))
params[0].size()
params

假设输入图像维度是32 _32 输出参数是十个参数大小1_10
然后就可以

3.损失函数

损失函数可以通过输入（input，target）和标签的差值进行计算
torch.nn 中有很多损失函数比如 nn.MSEloss 计算均方误差损失评估模型
代码如下（示例）：

output = net(input)
target = torch.randn(10)
target = target.view(1, -1)
criterion = nn.MSELoss()

loss = criterion(output, target)
print(loss)

计算流程图 input ->conv2d->relu-> maxpool2d ->conv2d->relu->relumaxpool2d->view->linear->relu->linear->relu->linear->MSEloss->loss
反向传播从有右向左
调用loss.backward()时，在整个计算图都会多loss进行微分，所有requires_grad=True的tensor张量的.都会累加到grad属性中。
不断追溯
pytorch入门——构建神经网络

4.反向传播

有了输出张量就可以进行 梯度归零(net.zero_grad()将其所有参数（包括子模块的参数）的梯度设置为零调用backward()函数之前都要将梯度清零，因为如果梯度不清零，pytorch中会将上次计算的梯度和本次计算的梯度累加。)
和 反向传播 net.zero_grad() out.backward(torch.randn(1,10))
调用 loss.backward() ，观察conv1 层bias的梯度反向传播前后的变化

net.zero_grad()

print('conv1.bias.grad before backward')
print(net.conv1.bias.grad)

loss.backward()

print('conv1.bias.grad after backward')
print(net.conv1.bias.grad)

5.更新网络参数

随即梯度下降SGD
weight = weight – learning_rate * gradient

import torch.optim as optim

optimizer = optim.SGD(net.parameters(), lr=0.01)

optimizer.zero_grad()

output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()

总结

以上就是今天要讲的内容
我们学习了构建一个神经网络的典型流程
1.学习了损失函数的定义
采用torch.nn.MSEloss均方误差
通过loss.backward()进行反向传播时整张计算图将对loss进行自动求导所有属性require_grad=Ture 的Tensor将被参与到梯度求导运算中梯度累加到tensor属性。grad中
2. 学习了反向传播的计算方法
loss.backward()
进行 梯度归零(net.zero_grad()将其所有参数（包括子模块的参数）的梯度设置为零调用backward()函数之前都要将梯度清零，因为如果梯度不清零，pytorch中会将上次计算的梯度和本次计算的梯度累加。
net.zero_grad()
out.backward()
3. 学习了参数的更新方法
定义优化器来执行参数的优化更行
optimizer = optim.SGD(net.parameters(), lr=0.01)
4.通过优化器来执行具体的参数更新
optimizer.step() # 真正的执行

Original: https://blog.csdn.net/qq_53536373/article/details/123707927
Author: 小杜今天学AI了吗
Title: pytorch入门——构建神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688271/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

deeplab-v3+原理详解

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、deeplab-v3+提出原因与简单介绍二、deeplab-v…

人工智能 2023年5月26日
0070
tensorflow2 auto mpg汽车油耗预测实践（3.5节）

tensorflow2 汽车油耗预测实践 * – tensorflow2 汽车油耗预测实践 – + 1. 数据集 + * 1.1 Auto MPG * 1….

人工智能 2023年5月25日
0089
疫情在家用Python搞副业，也能月入10000+

下班副业实现经济自由的时候，你还在床上躺着，天天摆烂吗？这样的生活真的是你想要的吗？疫情在家接一些Python相关的小单子，既能给自己练手，还能赚是真香从零基础开始真的一台电脑…

人工智能 2023年7月30日
0053
初探三维计算机视觉（三维重建） —— 相机模型 + 双目系统 + 点云模型

初探三维计算机视觉（三维重建）—— 相机模型 + 双目系统 + 点云模型目录 * – 初探三维计算机视觉（三维重建）—— 相机模型 + 双目系统 + 点云模型 &#8…

人工智能 2023年7月18日
00162
论文笔记：Universal Adversarial Triggers for Attacking and Analyzing NLP

论文链接：https://arxiv.org/abs/1908.07125 代码开源：https://github.com/Eric-Wallace/universal-trigg…

人工智能 2023年5月31日
0097
数字图像处理——最大类间方差法（OTSU）图像阈值分割实例

数字图像处理——最大类间方差法（OTSU）图像阈值分割实例数字图像处理——最大类间方差法（OTSU）图像阈值分割实例图像阈值分割是指通过以某个确定的图像灰度值（灰度级）将图像分…

人工智能 2023年6月18日
0078
Google Earth Engine——250米处美国农业部土壤分类的预测数据集

Predicted USDA soil great group probablities at 250m Distribution of the USDA soil great g…

人工智能 2023年7月3日
00106
什么牌子蓝牙耳机玩游戏好用？游戏低延迟蓝牙耳机排行

无线耳机已经成为年轻人乘坐公共交通的必需品。如果你戴上耳塞，你就可以静静地沉浸在视听世界中，瞬间到达目的地。因此，很多年轻人都在寻找性价比高的蓝牙耳机。毕竟，生活中的任何地方都需要…

人工智能 2023年5月25日
0068
模拟退火算法详细讲解（含实例python代码）

模拟退火算法详细讲解（含实例python代码）（一）模拟退火算法简介（二）模拟退火算法原理（三）退火过程中参数控制（四）算法步骤（五）实例分析最近老师要求做模拟退火算法…

人工智能 2023年6月15日
0083
安装torchvision-0.12.0+cu113版本

本来想实现多层感知机的算法 ①y但是需要导入一个d2lzh_pytorch包解决方法：在网上下载了一个d2lzh_pytorch包的文件夹，放在Lib/site-pakeage目…

人工智能 2023年7月28日
0047
什么是UDP、TCP,怎么用UDP和TCP实现网络通信和数据传输

网络编程：就是让两台计算机进行数据交互网络编程三要素 IP地址：设备在网络中的地址，是唯一的标识端口：应用程序在设备中的唯一标识协议：数据在网络中传输的规则，常见的协议有UD…

人工智能 2023年6月29日
0096
高斯过程回归（输出学习法！）

Gaussian Process Regression 概述 * 多元高斯分布的定义高斯过程一、Weight-space View * 1.1 标准贝叶斯线性模型 1.2 Fe…

人工智能 2023年6月18日
0080
R语言dplyr包为dataframe添加数据列实战（ Add Columns）：基于mutate()函数添加一个或者多个数据列（尾部添加、头部添加、条件生成、某个具体数据列的前后）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0069
基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码

基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码文章目录基于蝙蝠算法优化BP神经网络的数据分类算法及其MATLAB实现-附代码 1 蝙蝠算法与BP神经网络…

人工智能 2023年7月3日
0081
python pandas ewm 一次指数加权移动平均

文章目录一、公式二、DataFrame.ewm() 参数 * com span halflife alpha min_periods adjust ignore_na axis…

人工智能 2023年7月16日
0056
vscode配置头文件——以Opencv和自己的头文件为例

在windows系统下，使用VS studio配置opencv或者自己的头文件很简单，网上可用教程很多，本文不再赘述。但VS studio使用的msvc编译器并不是跨平台的，本文主…

人工智能 2023年7月18日
0050

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31