解决RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: “conv1.0…

2023年6月16日下午2:01 • 人工智能 • 阅读 59

在多GPU环境下用Pytorch训练的Resnet分类网络

卷积神经网络ResNet训练好之后，测试环境或测试代码用了单GPU版或CPU版，在加载网络的时候报错，报错处代码为：

net.load_state_dict(torch.load(args.weights))

报错如下：

RuntimeError: Error(s) in loading state_dict for ResNet:
    Missing key(s) in state_dict: "conv1.0.weights", "conv1.1.weights", "conv1.1.bias", ...

出现这种报错的原因主要是，state_dict加载模型权重时，参数不匹配。可能是PyTorch版本环境不一致、torch.nn.DataParallel()关键字不匹配、训练环境与测试环境GPU不同。

我遇见这种报错，一次是因为GPU进行训练，CPU进行测试；另一次是多GPU进行训练，测试时对GPU部分的处理，没有按照训练时做多GPU处理，是单GPU。

情况一：多GPU训练，测试时代码为单GPU
解决方案：在环境中定义GPU为多GPU，定义关键字torch.nn.DataParallel()

import torch.nn as nn
import os

os.environ["CUDA_VISIBLE_DEVICES"] = "0, 1, 2, 3"

if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('-gpu', action='store_true', default=True, help='use gpu or not')
    ......
    ......
    ......

    net = get_network(args)

    net = net.cuda()
    net = nn.DataParallel(net, device_ids=[0, 1, 2, 3])

    net.load_dict(torch.load(args.weights))
    net.eval()
    ......
    ......
    ......

情况二：GPU训练，测试时代码为CPU
解决方案：在加载模型权重时，设置 map_location='cpu'

if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('-gpu', action='store_true', default=True, help='use gpu or not')
    ......
    ......
    ......

    net = get_network(args)

    net.load_dict(torch.load(args.weights, map_location='cpu'))
    net.eval()
    ......
    ......
    ......

情况二还有可能出现的报错提示如下：

RuntimeError: Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is False. If you are running on a CPU-only machine, please use torch.load with map_location=torch.device('cpu') to map your storages to the CPU.

参考博文：

还有训练与测试参数不匹配的情况可以参考博文：

Original: https://blog.csdn.net/qq_39691492/article/details/125675091
Author: 小白白程序员
Title: 解决RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: “conv1.0…

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624594/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图神经网络（10）- relational GCN

目录 Heterogeneous Graphs（异质图）——有多种类型的边 relational GCN 一种关系的有向图有多种关系的有向图总结摘要：从普通的GNN拓展到可以…

人工智能 2023年6月10日
0097
【技术白皮书】第一章：基于深度学习的文本检测与识别的技术背景

1.技术背景 1.1技术背景——什么是文本检测与识别 OCR全称Optical Character Recognition，即光学字符识别，最早在1929年被德国科学家Taus…

人工智能 2023年6月20日
00109
随笔1：关于元素定位只能使用driver.find_element()这件事

1、首先看第2点的截图 driver.find_element_by_id直接标黄报错了，但还是先执行下 from selenium import webdriver driver…

人工智能 2023年7月5日
00108
matlab：鼠标循环点击器

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0056
如何在Seaborn柱形图顶端添加数字——以奥运数据分析为例

如何在Seaborn柱形图顶端添加数字——以奥运数据分析为例 1.问题的提出之前暑期在家，闲着没事干的时候想写点基础的代码巩固下自己python知识，于是就上Kaggle下了一套…

人工智能 2023年7月16日
00104
谷歌翻译工具新改版，支持全球51种语言翻译功能

2009年11月26日，谷歌宣布翻译工具(http://translate.g.cn 或者 http://翻译.g.cn)全新改版，除了整体产品界面全新上线外，新版还增加了包括实时…

人工智能 2023年5月25日
0092
【记录】服务器搬家记录

服务器重新搬家真的好累, 搞了6个小时, 大半的时间在备份, 在传输(宽带不行), 以及重装后的开发环境配置. 反而是docker容器花的时间不多, 但是配置docker的时间也很…

人工智能 2023年7月29日
0055
【TensorFlow】TensorFlow与cuda版本以及Keras版本以及python版本对应关系（2022年6月附官网链接，永久更新）

目录一、前言二、Tensorflow与cuda版本以及python版本对应关系 * Linux – CPU GPU macOS 三、TensorFlow与Keras…

人工智能 2023年7月4日
00119
python使用python-docx自动化操作word

一、python-docx库简介二、读写Word文档 2.1 创建Word文档对象 2.2 获取Word文档中的对象 2.3 将数据写入Word文档三、修改Word文档样式四…

人工智能 2023年7月15日
0063
python + opencv + 二值化处理图片数据集（三种方法）

二值化处理图片数据集首先导入相应的包 cv2即opencv-python包 if __name__ == "__main__": 上面这一句话的含义：自己的…

人工智能 2023年7月19日
0062
MM-Detection Logs —— 自定义数据集下的模型训练（Linux）

MM-Detection Logs（2022.04.03） 1. 自定义数据集 2. 设置模型参数与配置 * 2. 1. 以Faster R-CNN为例，首先先打开Faster R…

人工智能 2023年7月10日
00128
数据分析：pandas

pandas 常用数据类型 * Series创建 – Series切片和索引 DataFrame – 读取外部数据 dataframe创建 datafram…

人工智能 2023年7月6日
0070
DeepHyperX代码理解-HamidaEtAl

代码复现自论文《3-D Deep Learning Approach for Remote Sensing Image Classification》先对部分基础知识做一些整理：…

人工智能 2023年6月3日
00121
详解LK光流法（含金字塔多层光流），反向光流法（附代码）

LK光流法可用来跟踪特征点的位置。比如在img1中的特征点，由于相机或物体的运动，在img2中来到了不同的位置。后面会称img1为Template（T），img2为I。光流法有个…

人工智能 2023年5月26日
00109
MMCV-Registry类代码详解(1)

1.功能简介 2.初始化函数参数说明：构造函数优先级： 2.1self.infer_scope()方法 2.2_add_children()方法源码在工程中的路径为mmcv/…

人工智能 2023年7月12日
0083
您有一个新的订单语音_视频中语音转文字-科大听见

有时写报告和文稿，会遇到需要把从视频或音频转成文字的时候，本人试了几个网页版和APP应用，发现科大讯飞的讯飞听见的体验比较好，而且目前有1个小时的免费时长（机器快转）。讯飞听见的…

人工智能 2023年5月27日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

解决RuntimeError: Error(s) in loading state_dict for ResNet: Missing key(s) in state_dict: “conv1.0…

大家都在看