1.训练速度
keras坑很多
训练网络时,以下会不同程度上影响速度:
1)imagedatagenerator,如果进行数据增强
2)图片尺寸
3)model.fit。虽然model.fit也支持generator,但速度比fit_generator慢很多
以下不一定能提升训练速度
3)网络中trainable参数个数
2.显存不够
如果数据集太大,会报OOM错误
减小batchsize效果不明显
可将flow改成flow_from_directory,同时注意train、val的类别与对应label
也可以将keras预训练的resnet50的trainable设置成false,但此时需要用transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])将输入图片归一化,因为imagenet数据集输入是0-1【不知道是不是这样,但设置成false后不归一化是肯定不行的。按理来说如果设成True,那么即使不归一化resnet50权重也会去适应数据】
model = multi_gpu_model(model, gpus=4)后model层数、权重等都会改变,此时使用model.summary()会发现很多层不见了。之后save、loadweights时,也需要使用multi_gpu_model(model, gpus=4)
由于imagenet是-1~1,0为中心的,所以用imagedatagenerator时要用预处理函数直接rescale比较好
另外用resnet50的preprocess_input和utils的preprocess_input是不一样的,自己查.目前的建议是用的哪个预训练模型,就用哪个模型的preprocess_input。此外,用预训练模型,不需要rescale=1/255
内存不够,无法一下子将test集读进来。用test_generator,shuffle需设置成false,否则test样本顺序不对。bs=1.此外,文件顺序用generator.filename
此外,用pandas生成csv时,人工检查下csv里各列的顺序和list里的顺序是否相同
Original: https://blog.csdn.net/weixin_37198422/article/details/121704032
Author: 人间真正走过~
Title: 菜品分类与检索大作业踩坑
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/666323/
转载文章受原作者版权保护。转载请注明原作者出处!