【成功 debug】Assertion idx_dim >= 0 && idx_dim < index_size && “index out of bounds“

在 gpu 上跑 torch 代码的时候遇到了如题所示的问题,原因大概率是某行代码 id 溢出,但是如何定位出 bug 的代码呢?

尝试设置: CUDA_LAUNCH_BLOCKING=1 (didn’t work)

这时应该讲代码放到 cpu 上跑,就能精准报错了。

解决步骤

我的问题最后定位在: RuntimeError: index -9223372036854775808 is out of bounds for dimension 3 with size 40624

这个 index 的值无比诡异,某大神告诉我可能是数据类型存错了:
【我感觉是binary的时候出问题了】
【检查一下数据类型,binarizer 只能 dump int,是不是存了别的类型】
check 之后果然是数据类型的问题,我给存成 float 了,应该是 int64

最后成功解决所有问题。

Original: https://blog.csdn.net/qq_53528578/article/details/126700927
Author: 花飞满城
Title: 【成功 debug】Assertion idx_dim >= 0 && idx_dim < index_size && “index out of bounds“

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/707603/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球