pytorch中model.parameters()和model.state_dict()使用时的区别

2023年6月25日上午5:46 • 人工智能 • 阅读 103

联邦学习模拟实验中涉及模型参数的聚合和广播，需要提取模型参数。这个时候一般有两个选择，model.parameters() 和 model.state.dict()。表面上看这两者的区别只在于 model.parameters() 方法返回的是一个生成器 generator，里面只有模型的参数，而没有对应的网络层名称；而 model.state_dict() 返回的则是一个字典 {key:value}，key 是网络层名称，value 则是该层的参数。

但我实际做实验的时候发现，分别用这两种方法进行聚合的实验结果相去甚远，测试准确率甚至能相差 10 个点以上。

一波网上搜索发现，当模型中有非训练参数时，这两者其实还有区别，即 model.parameters() 只包含可训练参数，而 model.state_dict() 则包含了所有参数。
比如批量归一化层 BN layer 除了 2 个可训练参数 α \alpha α 和 β 外，还有 running_mean 和 running_var 这2个统计量，而 model.parameters() 是不包含这两个统计量的，只有 model.state_dict() 将这两个统计量包含在其中。
至于是否把这两个统计量纳入聚合的范畴，可以看我之前总结的BN在联邦学习中的应用

所以，如果是用 model.parameters() 来提取参数进行聚合和广播的话，相当于每个客户端还保留了自己的非训练参数，如 running_mean 这种统计参数，那这是否相当于一种个性化设计呢？那还能不能用单一的全局模型来做最后的性能测试呢？

我自己做了实验，在使用 model.parameters() 来提取参数的情况下，用全局模型和本地模型来对同一测试集做预测的结果确实有很大出入！这时候的全局模型准确率只有 20% 左右，而本地模型可以去到 70%+。

如果有小伙伴有不同的实验结果或不同的见解，欢迎来一起讨论！

参考：
https://discuss.pytorch.org/t/batch-norm-parameters-not-included-in-model-parameters/10265

Original: https://blog.csdn.net/weixin_42534493/article/details/123571932
Author: 联邦学习小白
Title: pytorch中model.parameters()和model.state_dict()使用时的区别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650338/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Opencv-Python图像预处理之手掌指纹提取

Opencv-Python图像预处理之手掌指纹提取@TOC 读取图像首先用到Opencv的imread（）函数将要预处理的图像进行读取 ”’ 读取图像 ”’ img = cv…

人工智能 2023年7月19日
0059
基于集成算法投票的波士顿房价数据集回归问题

基于集成算法投票的波士顿房价数据集回归问题 1. 作者介绍 2．关于理论方面的知识介绍 * – 2.1 集成学习 2.2 随机森林 2.3 数据集介绍 3．实验相关 *…

人工智能 2023年6月18日
0089
js函数定义方式的区别

1：调用关键字function来构造 functiondistance(x1,x2,y1,y2) vardx=x2-x1; vardy=y2-y1; returnmath.sqrt…

人工智能 2023年6月29日
0079
python 基于残差ResNeXt与UNet的优化网络

基于残差ResNeXt与UNet的优化网络 * – 一、环境配置 – 二、目录说明 – 三、训练 – + 3.1 模型训练 + 3….

人工智能 2023年5月23日
00117
cv2.VideoCapture从摄像头获取视频流并处理但是处理速度慢

载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_40802676/article/details/107012916 cv2.Vi…

人工智能 2023年5月26日
0066
pandas读取excel文件 pandas.read_excel参数详解

pandas. read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, s…

人工智能 2023年7月7日
0081
halcon模板匹配 ——多个不同对象同时匹配

文章目录场景效果实现步骤 * 1.读取图像 2.分别生成两个ROI 3.分别创建各向同性比例缩放形状模板 4.分别获取形状模型的轮廓表示 5.连接两个模板轮廓XLD 6.保存…

人工智能 2023年5月28日
00218
deep sort yolov7 pytorch实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月21日
0059
matlab目标跟踪目标检测项目系统源码合集【33套】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月9日
0081
2023学年持IB成绩申请NTU入学流程指南

请申请者注意，这期的招生信息是从学校的英文官方网站上摘取一些大家比较关心的内容做的翻译，以方便中国的学生和家长对南大的招生有一个初步的了解，并不代表全面的招生信息。另外学校的招生信…

人工智能 2023年6月28日
0089
python爬虫 – 代理ip正确使用方法

主要内容：代理ip使用原理，怎么在自己的爬虫里设置代理ip，怎么知道代理ip是否生效，没生效的话哪里出了问题，个人使用的代理ip(付费）。目录代理ip原理输入网址后发生了什么…

人工智能 2023年7月5日
0072
Spark SQL 之 DataFrame

Spark SQL是Spark的一个组件，用于结构化数据的计算。Spark SQL提供了一个称为DataFrames的编程抽象，DataFrames可以充当分布式SQL查询引擎。 …

人工智能 2023年6月2日
0096
基于Tensorflow2.x的CNN的病虫害分类（有界面）

基于Tensorflow2.x的ResNet-50的病虫害分类讲解（有界面）：基于Tensorflow2.x的CNN的病虫害分类j讲解（有界面）讲解：(39条消息) 基于Tens…

人工智能 2023年5月24日
00108
未来十年的Python前景会是什么样的？

看了一些文章的答案，我觉得的没有一答案是真正的站在10年后角度来讨论这个问题的，讨论的其实都是现在python的现状或问题，我觉得讨论这种问题时，我们一方面要理性分析，另一方面一定…

人工智能 2023年7月31日
0054
知识图谱 ppt_送你浙大陈华钧教授《知识图谱导论》课程系列PPT

来源：专知本文约 1500字，建议阅读 10分钟。本文为你介绍了浙江大学计算机学院陈华钧教授的课程《知识图谱导论》。知识图谱是人工智能的前沿科技之一，近两年非常火热。无论你是…

人工智能 2023年6月1日
0061
【mmdetection】mmdetection安装详细步骤

mmdetection是由商汤科技和香港中文大学开源了一个基于Pytorch实现的深度学习计算机视觉工具箱，涵盖了目标检测、实例分割、全景分割、模型蒸馏等计算机视觉任务，复现了最新…

人工智能 2023年7月27日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch中model.parameters()和model.state_dict()使用时的区别

大家都在看