错误：Assertion `input_val ＞= zero && input_val ＜= one` failed.

2023年7月27日下午8:24 • 人工智能 • 阅读 63

在用服务器跑模型计算loss时，出现如下错误：Assertion input_val >= zero && input_val</p> <pre><code>/opt/conda/conda-bld/pytorch_1640811757556/work/aten/src/ATen/native/cuda/Loss.cu:115: operator(): block: [428,0,0], thread: [61,0,0] Assertioninput_val >= zero && input_val <= 0 440 one` failed. 0%| | [00:02 traceback (most recent call last): file "train_normal.py", line 212, in <module>
train(net)
File "train_normal.py", line 109, in train
train_loss = solver.optimize()
File "/home/liuming/mmq/Hi/framework.py", line 87, in optimize
loss = self.loss(self.mask, pred)
File "/home/liuming/mmq/Hi/loss/dice_bce_loss.py", line 45, in __call__
a = self.bce_loss(y_pred, y_true)
File "/home/liuming/.conda/envs/mmqpytorch/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl
return forward_call(*input, **kwargs)
File "/home/liuming/.conda/envs/mmqpytorch/lib/python3.8/site-packages/torch/nn/modules/loss.py", line 603, in forward
return F.binary_cross_entropy(input, target, weight=self.weight, reduction=self.reduction)
File "/home/liuming/.conda/envs/mmqpytorch/lib/python3.8/site-packages/torch/nn/functional.py", line 2915, in binary_cross_entropy
return torch._C._nn.binary_cross_entropy(input, target, weight, reduction_enum)
RuntimeError: CUDA error: device-side assert triggered</=>

综合查到的资料、观点，解决思路总结如下：

1、查看cuda版本和python版本是否匹配，如不匹配，需要重新安装。

PS:因为我用我的环境跑过好多网络，所以这个问题不存在。

2、batch_size设置的太大，可以适当减小些。

3、查看num_class是否等于类别数，因为我做的是语义分割二分类任务，所以num_class设置为2。

3、该错误大多出现在loss函数附近，所以可以检查下生成的预测图和mask图shape是否一致：

#predict为预测图，mask为输入的标签图
a = predict.shape
b = mask.shape
print(a,b)

若a=b，则两者相同，问题不出在这。

4、用isnan（）查看mask及预测图中是否含有未知数nan：

c = torch.isnan(y_true).any()
d = torch.isnan(y_pred).any()
print(c,d)
#y_true&#x4E3A;mask&#x56FE;&#xFF0C;y_pred&#x4E3A;&#x9884;&#x6D4B;&#x56FE;
#&#x82E5;&#x5747;&#x4E3A;FALSE&#xFF0C;&#x8BF4;&#x660E;mask&#x56FE;&#x548C;&#x751F;&#x6210;&#x7684;&#x9884;&#x6D4B;&#x56FE;&#x4E2D;&#x6CA1;&#x6709;nan

5、如果是bceloss，标签必须要在0到1之间，可以用assert函数判断输出loss函数需要的mask与pred的的max()，min()，若发现pred或mask的值没有映射到0-1之间，需要将最后输出的pred这里添加一个sigmoid（用于二分类）函数：

pred = nn.Sigmoid()(pred)

或在网络的def forward返回值前进行sigmoid操作。

Original: https://blog.csdn.net/weixin_43435855/article/details/126090321
Author: A徒手摘星星
Title: 错误：Assertion input_val ＞= zero && input_val ＜= one failed.

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719079/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Layer）？它在神经网络中的作用是什么

问题：在神经网络中，Layer（层）的作用是什么？在神经网络中，Layer（层）是神经网络的基本组成单元。层可以看作是数据处理的模块，它通过包含一系列可训练的参数，将输入数据映射…

人工智能 2024年1月3日
0046
【Linux】线程

【Linux】线程 1 为什么要有线程？首先，对于任何一个进程来讲，即便我们没有主动地去创建线程，进程也是默认有一个主线程的。线程是负责执行二进制指令的，而进程管的比线程多多…

人工智能 2023年7月20日
0070
Transformer编码器的理解与PyTorch实现

Transformer编码器的理解与PyTorch实现前言 Transformer模型的整体结构个人理解各部分PyTorch代码实现 * Encoder的代码实现 &#821…

人工智能 2023年7月21日
0084
KNN分类USPS, USI sonar及USI iris

KNN算法简介邻近算法，或者说K近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K近邻，就是k k k个最近的邻居的意思，说的…

人工智能 2023年7月2日
0080
【云原生Kubernetes系列第五篇】kubeadm v1.20 部署K8S 集群架构（人生这道选择题，总会有遗憾）

; 系列文章目录 😜即日起，更新云原生相关知识，喜欢的小伙伴可以给我点个三连喔😜收录至专栏云原生😜【云原生Docker系列第一篇】Docker镜像管理😜【云原生Docker系列第…

人工智能 2023年5月30日
0099
浙大Python程序设计（MOOC）习题答案

章节第一章 * 7-1 从键盘输入两个数，求它们的和并输出 7-2 从键盘输入三个数到a,b,c中，按公式值输出 7-3 输出”人生苦短，我学Python&#8221…

人工智能 2023年7月4日
00114
手动安装torch和torchviosn教程

二、从github下载到了一个项目后，第一件事就是查看requirements.txt，里头的torch和torchvision的版本，，若在里头已经指定了python版本，例如p…

人工智能 2023年7月27日
0059
安装Tensorflow（gpu版本）

一、安装Anaconda 文章结构： Anaconda 下载安装地址：https://www.anaconda.com/download/ 安装完毕： ; 二、安装tensorfl…

人工智能 2023年6月25日
0066
图像处理课设（奇怪版）

这是我做课设软件时候的经历（？） * – 开场白 – 界面设计、菜单栏 – 与ITK的假集成 – + 稍微介绍一下生成exe的方法 …

人工智能 2023年6月20日
00109
【模型解析】从V1-V5深入解析YOLO系列模型

从V1-V5 深入解析YOLO系列模型 yolo相对于R_CNN系列论文，创新之处在于不再需要候选区域，直接端到端，利用回归的思想，直接回归出边框和类别，大大加快了速度，同时精度也…

人工智能 2023年7月10日
0073
用Transformer实现OCR字符识别！

Datawhale干货作者：安晟、袁明坤，Datawhale成员在CV领域中，transformer除了分类还能做什么？本文将采用一个单词识别任务数据集，讲解如何使用trans…

人工智能 2023年7月16日
0056
Python—线性回归

目录 1.简单线性回归模型 2.多元线性回归模型 * 2.1 应用F检验法完成模型的显著性检验 2.2应用t检验法完成回归系数的显著性检验 3.基于回归模型识别异常点 4.含有离散…

人工智能 2023年6月18日
0075
当知识图谱遇上预训练语言模型

知识图谱与语言预训练是什么关系呢？本文就将从语言预训练模型开始，介绍知识对语言预训练模型的价值，并介绍几个前沿的知识图谱增强语言预训练模型。 01知识图谱与语言预训练关于&#8…

人工智能 2023年6月1日
00107
R语言编写自定义分段函数、R语言编程实现分段函数并可视化分段函数实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
00101
【Vision-Language】VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts

链接：https://arxiv.org/pdf/2111.02358.pdf 简介首先我们做一些背景介绍，什么是 vision-language？众所周知，目前人工智能涉及一个…

人工智能 2023年5月30日
0084
语音识别（利用python将语音转化为文字）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、申请讯飞语音端口 * 1.点击链接进入讯飞平台主页面 2.在页面注册自己的个人账户 3.申请语…

人工智能 2023年7月26日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

错误：Assertion `input_val ＞= zero && input_val ＜= one` failed.

大家都在看