关于yolov5训练时参数workers和batch-size的理解

2023年6月16日下午3:34 • 人工智能 • 阅读 71

关于yolov5训练时参数workers和batch-size的理解

*
– yolov5训练命令
– workers和batch-size参数的理解
– 两个参数的调优
– 总结

yolov5训练命令

 python .\train.py --data my.yaml --workers 8 --batch-size 32 --epochs 100

yolov5的训练很简单，下载好仓库，装好依赖后，只需自定义一下data目录中的yaml文件就可以了。这里我使用自定义的my.yaml文件，里面就是定义数据集位置和训练种类数和名字。

workers和batch-size参数的理解

一般训练主要需要调整的参数是这两个：

workers
指数据装载时cpu所使用的线程数，默认为8。代码解释如下

parser.add_argument('--workers', type=int, default=8, help='max dataloader workers (per RANK in DDP mode)')

一般默使用8的话，会报错~~。原因是爆系统内存，除了物理内存外，需要调整系统的虚拟内存。训练时主要看已提交哪里的实际值是否会超过最大值，超过了不是强退程序就是报错。

所以需要根据实际情况分配系统虚拟内存(python执行程序所在的盘)的最大值
关于yolov5训练时参数workers和batch-size的理解

batch-size
就是一次往GPU哪里塞多少张图片了。决定了显存占用大小，默认是16。

parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')

训练时显存占用越大当然效果越好，但如果爆显存，也是会无法训练的。我使用–batch-size 32时，显存差不多能利用完。

两个参数的调优

对于workers，并不是越大越好，太大时gpu其实处理不过来，训练速度一样，但虚拟内存（磁盘空间）会成倍占用。

workers为8时的内存占用

我的显卡是rtx3050，实际使用中上到4以上就差别不大了，gpu完全吃满了。但是如果设置得太小，gpu会跑不满。比如当workers=1时，显卡功耗只得72W，速度慢了一半；workers=4时，显卡功耗能上到120+w，完全榨干了显卡的算力。所以需要根据你实际的算力调整这个参数。

2. 对于batch-size，有点玄学。理论是能尽量跑满显存为佳，但实际测试下来，发现当为8的倍数时效率更高一点。就是32时的训练效率会比34的高一点，这里就不太清楚原理是什么了，实际操作下来是这样。

; 总结

以上参数的调整能最大化显卡的使用效率，其中的具体数值和电脑的实际配置还有模型大小、数据集大小有关，需要根据实际情况反复调整。当然，要实质提升训练速度，还是得有好显卡（钞能力）~~~~

Original: https://blog.csdn.net/flamebox/article/details/123011129
Author: flamebox
Title: 关于yolov5训练时参数workers和batch-size的理解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625088/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV】Blob斑点检测学习笔记

设置（SimpleBlobDetector）参数： params=cv2.SimpleBlobDetector_Parms() 改变阈值: params.minThreshold=…

人工智能 2023年7月20日
0050
Python相片视频转卡通动漫风格效果源码方案

相片转卡通动漫风格的比较多，而且各大bat厂都有很多方案，很多都能免费用一段时间。市场上应用也算是比较广泛。本质就算通过api请求大厂服务器，然后返回一张风格画的图片。但是对于视频…

人工智能 2023年5月23日
0071
在 Pandas 中使用 Merge、Join 、Concat合并数据的效率对比

在 Pandas 中有很多种方法可以进行DF的合并。本文将研究这些不同的方法，以及如何将它们执行速度的对比。合并DF Pandas 使用 .merge() 方法来执行合并。 im…

人工智能 2023年7月6日
0075
时间序列模型-ARIMA

一、ARIMA模型基本概念 1.1 自回归模型（AR）描述当前值与历史值之间的关系，用变量自身的历史数据对自身进行预测；自回归模型必须满足平稳性的要求；（何为平稳性：见时间序列…

人工智能 2023年6月23日
00113
（三）局部加权线性回归

文章目录前言 1. 局部加权线性回归模型 2. 求解方法 3. 代码实现前言线性回归只能拟合线性曲面（广义的曲面），如果一个回归任务中的输出变量 y ( y ∈ R ) …

人工智能 2023年6月17日
0082
pandas groupby成列表、分层索引MultiIndex；python sort、sorted技巧篇

参考：https://www.it1352.com/1722954.html df = pd.DataFrame( {‘a’:[‘A’,’A’,’B’,’B’,’B’,’C’], …

人工智能 2023年7月7日
0061
超简单教你在树莓派上安装opencv（二）

超简单教你在树莓派上安装opencv（二）前言一、如何基于python3.9.2安装OpenCv？ * 1.1 查看自己系统位数及Python版本，跟对教程 1.2 换源 1….

人工智能 2023年6月3日
00149
多视图聚类（+incomplete multi view cluster)

1.A study of graph-based system for multi-view clustering 2.Consistency Meets Inconsistenc…

人工智能 2023年5月31日
00115
【matlab图像处理】图像的逻辑运算实践

中国史之【昭王攻荆楚】：周天子周昭王三次南征楚国的战争。周昭王亲率六师南征楚国，在汉水边准备渡江时，因为船只被人做了手脚而沉入水中，周人丧失六师于汉水中，遭到全军覆没的惨败。——来…

人工智能 2023年6月20日
00101
流程挖掘之图算法——望繁信VS Celonis

在详细说流程图算法之前，我先谈下学术界和商业界几种常见的流程图类型， 1）Petrinets（也叫Petri 网），2) Process Tree（简称PT 流程树），3）BPMN…

人工智能 2023年7月17日
0051
盲图像超分辨率重建 ( CVPR，2022) (Pytorch)（附代码）

🍊 这篇测评文章用心写了一个下午，个人觉得作为一个初学者入门教程，再合适不过了，敬请查阅 🍊 精选专栏，超分重建-代码环境搭建-知识总结 🍊 博主：墨理，2020年硕士毕业，目前从…

人工智能 2023年7月21日
0073
Jetson 系列——基于yolov5和deepsort的多目标头部识别，跟踪，使用tensorrt和c++加速

项目简介：代码地址：github地址:https://github.com/RichardoMrMu/yolov5-deepsort-tensorrtgitee地址:https:…

人工智能 2023年7月5日
0093
色调映射（Tone Mapping）

一、概述虽然HDR 图像有较大的动态范围，能更细致地反映真实场景，但他的缺点也很明显。一是同尺寸的数据比低动态范围图像大，需要更大的存储空间与传输带宽。二是难以输出，目前大多数显…

人工智能 2023年6月20日
0054
机器学习实战 | Python机器学习算法应用实践

作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/41本文地址：https://www.showmeai.tech/a…

人工智能 2023年7月26日
0082
WGAN(Wasserstein GAN)看这一篇就够啦，WGAN论文解读

WGAN论文地址：[1701.07875] Wasserstein GAN (arxiv.org) WGAN解决的问题原始GAN训练过程中经常遇到的问题：模式崩溃，生成器生成非…

人工智能 2023年6月23日
0081
pytorch模型保存、加载与续训练

🍊作者简介：秃头小苏，致力于用最通俗的语言描述问题🍊往期回顾：对抗生成网络GAN系列——GAN原理及手写数字生成小案例对抗生成网络GAN系列——DCGAN简介及人脸图像生成案例🍊…

人工智能 2023年7月20日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

关于yolov5训练时参数workers和batch-size的理解

关于yolov5训练时参数workers和batch-size的理解

yolov5训练命令

workers和batch-size参数的理解

两个参数的调优

; 总结

大家都在看