在 gpu 上跑 torch 代码的时候遇到了如题所示的问题,原因大概率是某行代码 id 溢出,但是如何定位出 bug 的代码呢?
尝试设置: CUDA_LAUNCH_BLOCKING=1
(didn’t work)
这时应该讲代码放到 cpu 上跑,就能精准报错了。
解决步骤
我的问题最后定位在: RuntimeError: index -9223372036854775808 is out of bounds for dimension 3 with size 40624
这个 index 的值无比诡异,某大神告诉我可能是数据类型存错了:
【我感觉是binary的时候出问题了】
【检查一下数据类型,binarizer 只能 dump int,是不是存了别的类型】
check 之后果然是数据类型的问题,我给存成 float 了,应该是 int64
最后成功解决所有问题。
Original: https://blog.csdn.net/qq_53528578/article/details/126700927
Author: 花飞满城
Title: 【成功 debug】Assertion idx_dim >= 0 && idx_dim < index_size && “index out of bounds“
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/707603/
转载文章受原作者版权保护。转载请注明原作者出处!