Pytorch：利用torch.nn.Modules.parameters修改模型参数

2023年10月28日下午1:41 • Python • 阅读 42

1. 关于parameters()方法

Pytorch中继承了 torch.nn.Module的模型类具有 named_parameters()/parameters()方法，这两个方法都会返回一个用于迭代模型参数的迭代器（ named_parameters还包括参数名字）：

import torch

net = torch.nn.LSTM(input_size=512, hidden_size=64)
print(net.parameters())
print(net.named_parameters())
#
#

我们可以将 net.parameters()迭代器和将 net.named_parameters()转化为列表类型，前者列表元素是模型参数，后者是包含参数名和模型参数的元组。

当然，我们更多的是对迭代器直接进行迭代：

for param in net.parameters():
    print(param.shape)
torch.Size([256, 512])
torch.Size([256, 64])
torch.Size([256])
torch.Size([256])
for name, param in net.named_parameters():
    print(name, param.shape)
weight_ih_l0 torch.Size([256, 512])
weight_hh_l0 torch.Size([256, 64])
bias_ih_l0 torch.Size([256])
bias_hh_l0 torch.Size([256])

我们知道，Pytorch在进行优化时需要给优化器传入这个参数迭代器，如：

from torch.optim import RMSprop
optimizer = RMSprop(net.parameters(), lr=0.01)

2. 关于参数修改

那么底层具体是怎么对参数进行修改的呢？

我们在博客《Python对象模型与序列迭代陷阱》中介绍过，Python序列中本身存放的就是对象的引用，而迭代器返回的是序列中的对象的二次引用，如果序列的引用指向基础数据类型，则是不可以通过遍历序列进行修改的，如：

my_list = [1, 2, 3, 4]
for x in my_list:
    x += 1
print(my_list) #[1, 2, 3, 4]

而序列中的引用指向复合数据类型，则可以通过遍历序列来完成修改操作，如：

my_list = [[1, 2],[3, 4]]
for sub_list in my_list:
    sub_list[0] += 1
print(my_list)
[1, 2, 3, 4]
[[2, 2], [4, 4]]

具体原理可参照该篇博客，此处我就不在赘述。这里想提到的是，用 net.parameters()/net.named_parameters()来迭代并修改参数，本质上就是上述第二种对复合数据类型序列的修改。我们可以如下写：

for param in net.parameters():
    with torch.no_grad():
        param += 1

with torch.no_grad()：表示将将所要修改的张量关闭梯度计算。所增加的1会广播到 param张量的中的每一个元素上。上述操作本质上为：

for param in net.parameters():
    with torch.no_grad():
        param += torch.ones(param.shape)

但是需要注意，如果我们想让参数全部置为0，切不可像下列这样写：

for param in net.parameters():
    with torch.no_grad():
        param = torch.zeros(param.shape)

param是二次引用， param=0操作再语义上会被解释为让 param这个二次引用去指向新的全0张量对象，但是对参数张量本身并不会产生任何变动。该操作实际上类似下列这种操作：

list_1 = [1, 2]
list_2 = list_1
list_2 = [0, 0]
print(list_1) # [1, 2]

修改二次引用 list_2自然不会影响到 list_1引用的对象。

下面让我们纠正这种错误，采用下列方法直接来将参数张量中的所有数值置0：

for param in net.parameters():
    with torch.no_grad():
        param[:] = 0 #张量类型自带广播操作,等效于param[:] = torch.zeros(param.shape)

这时语义上就类似

list_1 = [1, 2]
list_2 = list_1
list_2[:] = [0, 0]
print(list_1) # [0, 0]

自然就能完成修改的操作了。

Original: https://www.cnblogs.com/orion-orion/p/16293822.html
Author: orion-orion
Title: Pytorch：利用torch.nn.Modules.parameters修改模型参数

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/806921/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Conda 创建 Python 虚拟环境不纯净的问题(2021.1.18)

Conda 创建 Python 虚拟环境不纯净的问题(2021.1.18) Ubuntu 16.04； Conda 4.9.2； Python 3.6；通过 Conda 命令创建…

Python 2023年5月24日
0074
vivo大数据日志采集Agent设计实践

作者：vivo 互联网存储技术团队- Qiu Sidi 在企业大数据体系建设过程中，数据采集是其中的首要环节。然而，当前行业内的相关开源数据采集组件，并无法满足企业大规模数据采集的…

Python 2023年10月14日
0040
Torch和Numpy的高级索引，即，方括号中还有一个Tensor或Numpy

最近看代码，看到了一个Tensor的方括号中还有一个Tensor，给爷看懵了。 new_embeddings = new_token_embeddings[input_flags]…

Python 2023年8月25日
0053
上周热点回顾（11.21-11.27）

热点随笔： · Chrome 103支持使用本地字体，纯前端导出PDF优化 (葡萄城技术团队)· 电视剧里的代码真能运行吗？ (Crossin先生)· 新零售SaaS架构：多租户系…

Python 2023年10月14日
0044
【数据库大作业–酒店服务管理系统】

基于Python和MySQL的酒店服务管理系统前言一、需求分析二、数据库设计 * 1.需求分析 2.概念结构设计 2.逻辑结构设计 3.数据表设计三、应用系统设计四、安装…

Python 2023年8月1日
0068
Python基础：第012课——最小的程序框架（代码解析）

Python基础：第012课——最小的程序框架（代码解析）观看视频参考：pygame详细教程参考案例：游戏模块Pygame 作为一个入门级的游戏开发库，其实并不难学，只要掌握 …

Python 2023年9月21日
0052
Python制作的足球双人小游戏，你确定你不过来看看？

相关文件关注小编，私信小编领取哟！当然别忘了一件三连哟~~ 对了大家可以关注小编的公众号哟~~Python日志开发环境 Python版本：3.6.4相关模块：pygame模块；…

Python 2023年9月21日
0042
Django的使用

Django的创建命令找到文件所在位置—cmd workon django 回车 django-admin startproject 项目名称 Model的作用 —操…

Python 2023年8月4日
0044
Flask学习笔记： app = Flask(__name__) （上）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年8月9日
0056
python应用市场app爬虫_【Python实战】Scrapy豌豆荚应用市场爬虫

‘#j-search-list>li::attr(data-pn)’ 接下来，我们来分析APP的详情页，APP的名称所对应的HTML元素如图： APP…

Python 2023年10月4日
0044
封装一个丝滑的聊天框组件

需求背景应公司业务要求，需要做个聊天机器人，要适应不同的业务场景，大概就跟淘宝客服类似，发送消息，机器人自动回复。话不多说，直接开撸技术栈： react（hooks写法） +…

Python 2023年9月15日
0041
Dive into TensorFlow系列（1）-静态图运行原理

接触过TensorFlow v1的朋友都知道，训练一个TF模型有三个步骤：定义输入和模型结构，创建tf.Session实例sess，执行sess.run()启动训练。不管是因为历史…

Python 2023年10月28日
0026
python打包scrapy项目，可移植文件夹

python打包scrapy项目《打包结果是一个可移植的文件夹》这是打包后的文件结构，打包前只有Fund文件夹+hooks文件夹+scrapy.cfg+start.py第一步：st…

Python 2023年10月3日
0046
什么是微服务（通俗易懂）

其实网上有很多关于微服务介绍的博客，虽然多，也全，但是有一些对于新手来说不太友好，所以该篇文章我就本着：简单，通俗，一步到位的介绍一下什么是微服务就两句话（1）微服务就是一种…

Python 2023年10月1日
0030
SpringCloud 网关 Gateway

哈喽~大家好，这篇来看看SpringCloud 网关 Gateway。 🥇个人主页：个人主页🥈 系列专栏：【微服务】🥉与这篇相关的文章： SpringCloud Sent…

Python 2023年9月29日
0046
2022 年 Python 程序员值得学习的 8 种工具

哈喽大家好！我是IT界搬运喵。马上2022年，如果想在新的一年成为一名更好的 Python 开发人员，并正在寻找用于 Python 开发的最佳工具、库和最佳 IDE，那么你来对地…

Python 2023年8月13日
0043

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch：利用torch.nn.Modules.parameters修改模型参数

1. 关于parameters()方法

2. 关于参数修改

大家都在看