Pytorch避坑之：RuntimeError: Input type(torch.cuda.FloatTensor) and weight type(torch.FloatTensor) shoul

2023年6月16日下午4:49 • 人工智能 • 阅读 65

问题分析

Pytorch避坑之：RuntimeError: Input type(torch.cuda.FloatTensor) and weight type(torch.FloatTensor) shoul

就像是字面意思那样，这个错误是因为模型中的 weights 没有被转移到 cuda 上，而模型的数据转移到了 cuda 上而造成的
但是造成这个问题的原因却没有那么简单。
绝大多数时候，造成这个的原因是因为你定义好模型之后，没有对模型进行 to(device) 而造成的，但是，也有可能，是因为你的模型在定义的时候，没有定义好， *导致模型的一部分在加载的时候没有办法转移到 cuda上。

; 细节举例

比如我现在定义了一个模型 A，B，它们的结构如下：


import torch.nn as nn
import torch
import torch.utils.data as Data
from tqdm import tqdm
from torchvision import transforms,datasets
import numpy as np
import torchvision
from torch.optim import lr_scheduler

class A(nn.Module):
    def __init__(self):
        super(A,self).__init__()
        self.conv = nn.Conv2d(in_channels=3
                              ,out_channels=8
                              ,kernel_size=3)
        self.relu = nn.ReLU(inplace=True)

    def forward(self,x):
        out = self.conv(x)
        out = self.relu(out)
        B_model = B()
        out = B_model(out)
        return out

class B(nn.Module):
    def __init__(self):
        super(B,self).__init__()
        self.conv = nn.Conv2d(in_channels=8
                              ,out_channels=16
                              ,kernel_size=3)
        self.relu = nn.ReLU(inplace=True)

    def forward(self, x):
        out = self.conv(x)
        out = self.relu(out)
        return out

这个时候就会报错，而报错的原因，就是因为 torch 的流程是这样的：
首先将所有的模型加载，先从 A 开始，进入 A 的 init 中把所有的内容加载，然后，通过 main 函数中的 to(device) 操作，就把加载的所有内容和网络定义都放到 cuda 上了，但是注意！！！

改错思路

将所有的内容都放到 cpu 上运行，即：
但显然这是个治标不治本的方法，我们就没有办法使用 gpu 训练了，因此我们选择把所有的网络层（只要有参数需要训练的网络层）都放到 init 里面去定义，只在 forward 中写运行时的逻辑，即：

class A(nn.Module):
    def __init__(self):
        super(A,self).__init__()
        self.conv = nn.Conv2d(in_channels=3
                              ,out_channels=8
                              ,kernel_size=3)
        self.relu = nn.ReLU(inplace=True)
        self.b_module = B()

    def forward(self,x):
        out = self.conv(x)
        out = self.relu(out)
        out = self.b_module(out)
        return out

class B(nn.Module):
    def __init__(self):
        super(B,self).__init__()
        self.conv = nn.Conv2d(in_channels=8
                              ,out_channels=16
                              ,kernel_size=3)
        self.relu = nn.ReLU(inplace=True)

    def forward(self, x):
        out = self.conv(x)
        out = self.relu(out)
        return out

Original: https://blog.csdn.net/qq_42902997/article/details/122594017
Author: 暖仔会飞
Title: Pytorch避坑之：RuntimeError: Input type(torch.cuda.FloatTensor) and weight type(torch.FloatTensor) shoul

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625550/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

FPGA时序约束02——不同时序路径的分析方法

前言分别是触发器到触发器，触发器到输出端，输入端到触发器，输入端到输出端，其中输入端到输出端是纯组合逻辑路径，没有时钟，所谓的时序其实就是延时，故此处只分析前三种路径的时序。注…

人工智能 2023年6月27日
0076
基于 FPGA 图像处理之 RGB 转灰度算法的实现

1、基础知识 Gray 图像：灰度（gray）图像就是我们常说的黑白图像，由黑到白为灰阶为 0-255(8bit)。 YUV 是被欧洲电视系统所采用的一种颜色编码方法（属于 PAL…

人工智能 2023年6月22日
00108
如何裁剪视频画面尺寸？快把这些方法收好

小伙伴平常会制作视频吗？有时我们制作视频时，会在网上收集一些不错的素材来充实视频的内容。可是这些素材它们的尺寸大小并不统一，如果直接剪辑在一起，就会出现视频黑边的情况。其实我们可以…

人工智能 2023年6月29日
00142
数学建模|预测方法：灰色预测模型

简介灰色系统理论是由华中理工大学邓聚龙教授于1982年提出并加以发展的。二十几年来，引起了不少国内外学者的关注，得到了长足的发展。目前，在我国已经成为社会、经济、科学技术在等诸多…

人工智能 2023年6月19日
0091
从TensorFlow到DL4J——主流深度学习框架对比分析

从TensorFlow到DL4J——主流深度学习框架对比分析 2022年2月22日极链AI云官网地址点击注册更多AI小知识，关注《极链AI云》公众号文章目录从TensorF…

人工智能 2023年5月23日
0099
c# Class vs Structure

4.2 The Timer Class…………………………&…

人工智能 2023年6月26日
0075
1.直流无刷电机BLDC转速计算推论

前提：可以先看电机专栏的 2.有霍尔传感器BLDC换向原理_lakers_cbb的博客-CSDN博客。笔记是先从有道云笔记整理的，可能格式有些不对，如果想看有道云笔记，可以私信…

人工智能 2023年6月26日
0068
C++ 模板和泛型编程（掌握Vector等容器的使用）

1. 泛型泛型编程，一次编写就能泛化到各种数据类型，例如整数、浮点数、字符和布尔类型以及自己定义结构体、类。 C++通过模板的方式提供了泛型编程，包括函数模板和类模板，对应的…

人工智能 2023年6月4日
0070
Hadoop详细解析

背景知识 1.1、企业数据部的一般组织结构企业数据部的一般组织结构，适用于大中型企业。 1.2、企业数据部的业务流程分析业务流程：电商业务人员：针对活动专题页(活动的效果)有…

人工智能 2023年7月16日
0075
YOLOv5训练自己的数据集(超详细)

目录一、准备深度学习环境二、准备自己的数据集 1、创建数据集 2、转换数据格式 3、配置文件三、模型训练 1、下载预训练模型 2、训练四、模型测试五、模型推理 YOLO…

人工智能 2023年6月16日
00134
全网最全python实现数据挖掘，数据分析（matlablib，pandas，numpy，量化分析）（附源代码）

全网最全python实现数据挖掘，数据分析（matlablib，pandas，numpy，量化分析）（附源代码） ; 1.横直方图电影票房 2.散点图3月与10月每天的天气 3.条…

人工智能 2023年7月16日
0039
运行Faster-RCNN时出现 ModuleNotFoundError: No module named ‘lib.utils.cython_bbox‘

运行Faster-RCNN时出现 ModuleNotFoundError: No module named ‘lib.utils.cython_bbox’ …

人工智能 2023年5月25日
0075
[GAN]CelebAMask-HQ数据集处理、划分

CelebAMask数据集是2020年MaskGAN这篇文章一起提出的，这篇文章主要讲了利用用户修改后的语义分割信息来引导图像编辑。港中文和商汤合作的，还是蛮不错的一篇文章。文章链…

人工智能 2023年7月28日
00144
Zabbix6通过ODBC方式监控Oracle 19C最佳实践

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月2日
0048
ADAS相关名词解释

ADAS(advanced driving assistance system)高级驾驶辅助系统DA(driver assistance)驾驶辅助PA(partial automa…

人工智能 2023年6月10日
0063
MobileNetV2神经网络

MobileNetV2神经网络 MobileNet是一个轻量化网络的经典网络，自诞生以来就被广泛应用于工业界。2016年，Google第一次提出了MobileNetV1，凭借深度可…

人工智能 2023年7月14日
0071

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pytorch避坑之：RuntimeError: Input type(torch.cuda.FloatTensor) and weight type(torch.FloatTensor) shoul

大家都在看