pytorch中nn.Parameter()使用方法

2023年6月29日上午7:28 • 人工智能 • 阅读 63

对于 nn.Parameter()是pytorch中定义 可学习参数的一种方法，因为我们在搭建网络时，网络中会存在一些矩阵，这些矩阵内部的参数是可学习的，也就是可梯度求导的。

对于一些常用的网络层，例如 nn.Conv2d()卷积层、 nn.LInear()线性层、 nn.LSTM()循环网络层等，这些网络层在pytorch中的nn模块中已经定义好，所以我们搭建模型时可以直接使用，但是有些自定义网络在pytorch中是没有实现的，我们就需要自定义可学习参数，那就用到了nn.Parameter()这个函数。

该函数会为我们创建一个矩阵，该矩阵是默认可 梯度求导的，之后我们就可以利用这个矩阵进行计算，该函数需要传入的参数是一个tensor，一般我们会传入一个初始化好的tensor。

下面我们将使用一个简单的线性层作为实例，来理解如何使用nn.Parameter()。

在类中我们定义了一个线性层，输入维度是10，输出维度是3，对于nn.Linear()层内部已经封装好了nn.Parameter()，所以不需要我们自定义，直接使用即可。

class Net1(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(10, 3)

    def forward(self, x):
        return F.sigmoid(self.linear(x))

对于一个线性层，我们会需要两个矩阵，分别是权重W和偏置b，所以我们要用nn.Parameter()定义两个可学习参数，然后传入对应维度的tensor作为参数，之后就可以在forward中定义计算过程。

class Net2(nn.Module):
    def __init__(self):
        super().__init__()
        self.W = nn.Parameter(torch.randn(10, 3))
        self.b = nn.Parameter(torch.randn(3))

    def forward(self, x):
        return F.sigmoid(self.W @ x + self.b)

利用下面代码就可以看定义好的模型中的参数

model1 = Net1()
model2 = Net2()

for name, parameters in model1.named_parameters():
    print(name, ':', parameters.size())

for name, parameters in model2.named_parameters():
    print(name, ':', parameters.size())

linear.weight : torch.Size([3, 10])
linear.bias : torch.Size([3])
W : torch.Size([10, 3])
b : torch.Size([3])

Original: https://blog.csdn.net/m0_47256162/article/details/127822519
Author: 雷神
Title: pytorch中nn.Parameter()使用方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/658701/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python】ffmpeg的安装配置和python中使用ffmpy（保姆级图文）

目录 * – 1. ffmpeg的安装配置 – + 1.1 下载ffmpeg + 1.2 配置环境变量 + 1.3 测试安装ffmpeg结果 –…

人工智能 2023年7月6日
0084
RNN模型与NLP应用笔记(3)：Simple RNN模型详解及完整代码实现

一、写在前面终于到RNN了，这篇文章首先介绍简易RNN模型，我们会以问题导向的方式一步一步对简易RNN模型进行改进。同样本文参考了王树森教授的深度学习课程内容，感谢大佬们提供的帮…

人工智能 2023年6月25日
0069
二十七. 智能驾驶笔记之基于SCNN网络的车道线检测

第一部分概述第二部分 SCNN网络第三部分 SCNN网络关键代码分析第一部分概述车道线检测是智能汽车辅助驾驶系统环境感知模块中非常重要的一个功能. 从基于传统方法的计算…

人工智能 2023年7月12日
0061
模型如何处理不确定性或噪声

模型处理不确定性或噪声的问题在机器学习和数据建模中，不确定性和噪声是非常常见的问题。不确定性指的是模型对于输入数据的预测结果的良好度量，而噪声则是指输入数据中的随机误差。处理这些…

人工智能 2024年1月4日
0035
m1 Mac 使用 miniconda 安装python3.8.11 和 tensorflow2.5 & pytorch1.8（推荐）

人工智能 2023年5月26日
0061
深度学习进行情感分析（2）–LSTM

目录一.导入需要的库二.数据读取并查看三.使用word2vector生成词向量 1.先将评论转化为列表 2.使用w2v进行词向量的生成 3.查看生成的词向量四.将数据集划分…

人工智能 2023年7月23日
0057
【Java】总结一下Java中的JVM知识点

说一下 JVM 的主要组成部分？及其作用？通过从JVM物理结构图我们可以看到：1.JVM两个子系统：类加载子系统和执行引擎子系统；2.JVM两个组件：本地接口方法组件和内存空间组…

人工智能 2023年6月26日
0072
python 逻辑回归算法实现文本情感分类（Logistic Regression）

一、算法介绍逻辑回归模型是一种判别概率模型，直接学习条件概率分布 P（Y | X）作为预测模型。 · 二元逻辑回归模型：设 x = {x1, x2, ……,…

人工智能 2023年7月2日
0089
c语言实现语音检测vad_语音特征小结

在一个技术群中，聊到语音特征话题，看到一位大佬说：如果我来面试，会让求职者先讲十分钟的语音特征。看到这句话后，我一愣，如果让我讲十分钟的语音特征，我只会想到，MFCC，Bark谱，…

人工智能 2023年5月27日
0071
CV领域特征描述子1：HOG

CV领域特征描述子：HOG,SIFT–图片的简略替代 HOG：方向梯度直方图本质:梯度的统计信息，能够很好的反映局部图像的边缘、形状图像梯度基本原理：当图像中存在边…

人工智能 2023年6月22日
0048
第四章使用 matplotlib 绘制散点图

系列文章目录第一章使用 matplotlib 绘制折线图第二章使用 matplotlib 绘制条形图第三章使用 matplotlib 绘制直方图第四章使用 matplot…

人工智能 2023年7月14日
0054
4.2 各种各样的卷积层

### 回答1： fragstate _4.2_教程是一个关于计算机图形学的教学材料。它主要讲解了如何使用fragstate _4.2_这个图形渲染器来创建引人注目的视觉效果。这…

人工智能 2023年7月16日
00118
MySQL update正在执行中突然断电，数据是否更改成功？

今天有个朋友突然问到我这个问题，当我们的update语句执行过程中，服务器突然断电了会发生什么？其实这个问题主要在于对mysql update生命周期的理解，以及了解mysql 的…

人工智能 2023年6月27日
0079
理解yolov7网络结构

以下是yolov7网络结构配置的yaml，对每一层的输出加了注释。 parameters nc: 80 # number of classes depth_multiple: 1….

人工智能 2023年7月28日
0048
Framework是否提供了模型压缩和量化工具

问题：Framework是否提供了模型压缩和量化工具？详细介绍：在深度学习中，模型压缩和量化是一种常见的技术，旨在减少模型的尺寸、计算复杂度和内存占用，同时保留模型的准确性。在…

人工智能 2024年1月1日
0027
java 有类似pandas_java中的数据处理框架-Joinery的初次使用(类似于python中的pandas)…

由于用惯了python中的pandas，在写java代码时也想找找类似的框架，便发现了Joinery。 Meaven配置 joinery joinery-dataframe 1.9…

人工智能 2023年7月8日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pytorch中nn.Parameter()使用方法

大家都在看