2s-AGCN【复现】EOFError:Ranoutofinput问题解决记录(win10+pycharm)

win10上用 pycharm复现 2s-AGCN论文程序,在环境和文件路径都调通之后
在终端里输入 python main.py --config ./config/nturgbd-cross-view/train_joint.yaml
出现了下面的这样一个报错

[ Tue Apr 12 18:18:56 2022 ] Parameters:
{'work_dir': './work_dir/ntu/xview/agcn_joint', 'model_saved_name': './runs/ntu_cv_agcn_joint', 'config': './config/nturgbd-cross-view/train_joint.yaml', 'phase': 'train', 'sa
ve_score': False, 'seed': 1, 'log_interval': 100, 'save_interval': 2, 'eval_interval': 5, 'print_log': True, 'show_topk': [1, 5], 'feeder': 'feeders.feeder.Feeder', 'num_worke
r': 32, 'train_feeder_args': {'data_path': './data/ntu/xview/train_data_joint.npy', 'label_path': './data/ntu/xview/train_label.pkl', 'debug': False, 'random_choose': False, '
random_shift': False, 'random_move': False, 'window_size': -1, 'normalization': False}, 'test_feeder_args': {'data_path': './data/ntu/xview/val_data_joint.npy', 'label_path':
'./data/ntu/xview/val_label.pkl'}, 'model': 'model.agcn.Model', 'model_args': {'num_class': 60, 'num_point': 25, 'num_person': 2, 'graph': 'graph.ntu_rgb_d.Graph', 'graph_args
': {'labeling_mode': 'spatial'}}, 'weights': None, 'ignore_weights': [], 'base_lr': 0.1, 'step': [30, 40], 'device': [0], 'optimizer': 'SGD', 'nesterov': True, 'batch_size': 1
6, 'test_batch_size': 16, 'start_epoch': 0, 'num_epoch': 50, 'weight_decay': 0.0001, 'only_train_part': False, 'only_train_epoch': 0, 'warm_up_epoch': 0}

[ Tue Apr 12 18:18:56 2022 ] Training epoch: 1
  0%|                                                                                                                                                | 0/1204 [00:09<?, ?it/s]
Traceback (most recent call last):
  File "main.py", line 578, in <module>
    processor.start()
  File "main.py", line 519, in start
    self.train(epoch, save_model=save_model)
  File "main.py", line 379, in train
    for batch_idx, (data, label, index) in enumerate(process):
  File "D:\anaconda3\envs\wq\lib\site-packages\tqdm\std.py", line 1195, in __iter__
    for obj in iterable:
  File "D:\anaconda3\envs\wq\lib\site-packages\torch\utils\data\dataloader.py", line 291, in __iter__
    return _MultiProcessingDataLoaderIter(self)
  File "D:\anaconda3\envs\wq\lib\site-packages\torch\utils\data\dataloader.py", line 737, in __init__
    w.start()
  File "D:\anaconda3\envs\wq\lib\multiprocessing\process.py", line 105, in start
    self._popen = self._Popen(self)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\context.py", line 223, in _Popen
    return _default_context.get_context().Process._Popen(process_obj)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\context.py", line 322, in _Popen
    return Popen(process_obj)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\popen_spawn_win32.py", line 65, in __init__
    reduction.dump(process_obj, to_child)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\reduction.py", line 60, in dump
    ForkingPickler(file, protocol).dump(obj)
OSError: [Errno 22] Invalid argument
Traceback (most recent call last):
  File "", line 1, in <module>
  File "D:\anaconda3\envs\wq\lib\multiprocessing\spawn.py", line 105, in spawn_main
    exitcode = _main(fd)
  File "D:\anaconda3\envs\wq\lib\multiprocessing\spawn.py", line 115, in _main
    self = reduction.pickle.load(from_parent)
EOFError: Ran out of input

我的第一反应是线程的问题,但是发现在训练文件 work_dir/ntu/xview/agcn_bone/config.yaml下,怎么改 num_worker都不行,只要程序一运行,又变成了默认的 32,如下图所示

2s-AGCN【复现】EOFError:Ranoutofinput问题解决记录(win10+pycharm)
后来发现,这个 config.yaml文件是代码生成文件,要是修改的话,需要到 main.py函数文件下的 def get_parser():里面去修改
2s-AGCN【复现】EOFError:Ranoutofinput问题解决记录(win10+pycharm)

num_worker=0表示只有主进程去加载 batch数据,这个可能会是一个瓶颈。
num_worker=1表示只有一个 worker进程用来加载 batch数据,而主进程是不参与数据加载的。这样速度也会很慢。
num_workers>0 表示只有指定数量的worker进程去加载数据,主进程不参与。增加 num_worker也同时会增加 CPU内存的消耗。所以 num_worker的值依赖于 batch size和机器性能。
一般开始是将 num_worker设置为等于计算机上的 CPU数量
最好的办法是缓慢增加 num_worker,直到训练速度不再提高,就停止增加 num_worker的值。
上面关于num_worker的说明转自下面大佬的文章,这里大家点过去看可能不方便,我就重新改在这里啦
https://www.jianshu.com/p/16860e392844

Original: https://blog.csdn.net/labview520/article/details/124129355
Author: 你个辣子
Title: 2s-AGCN【复现】EOFError:Ranoutofinput问题解决记录(win10+pycharm)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/712813/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球