yolov5ds-断点训练、继续训练、先终止训练并调整最终epoch（yolov5同样适用）

2023年7月25日下午7:20 • 人工智能 • 阅读 108

参考链接
1. 训练过程中中断了，继续训练
如果觉得数值差不多稳定了，但是距离最终设置的epoch还很远，所以想要停止训练但是又得到yolov5在运行完指定最大epoch后生成的一系列map、混淆矩阵等图
2. 训练完原有epoch，但还继续训练（与参考链接操作不同）

参考链接

🍀yolov5 继续训练
🍅yolov5ds：Yolov5同时进行目标检测和分割分割（yolov5ds作者的博客介绍）
github地址：👉yolov5ds
训练yolov5ds案例：用YOLOv5ds训练自己的数据集——同时检测和分割

两种情况：

训练过程中中断了，继续训练
训练完了，但是未收敛，在这个基础上，还想用这个权重、学习率等参数继续训练多一些批次

不再需要断点训练后，就一定要记得把以下修改全部都恢复成原状！！！

训练过程中中断了，继续训练

断电、或者什么原因中断了，比如设定epoch为200，但是在90这里中断了，想从断点这里 继续训练到 200个epoch

直接在 trainds.py设置参数 --resume的 defualt=True即可（在代码 517行附近）

parser.add_argument('--resume', nargs='?', const=True, default=True, help='resume most recent training')

或者参考这个芒果大佬的方式：直接调用命令行开始resume，他还变了加载的权重（我没有变，但是也能行，保险起见还是参照大佬的方式吧，我是从这篇博文里面摘录过来的：手把手调参最新 YOLOv7 模型训练部分 – 最新版本（二））

python train.py --resume D:\Pycharm_Projects\yolov7\runs\train\exp19\weights\last.pt

yolov5ds-断点训练、继续训练、先终止训练并调整最终epoch（yolov5同样适用）

如果觉得数值差不多稳定了，但是距离最终设置的epoch还很远，所以想要停止训练但是又得到yolov5在运行完指定最大epoch后生成的一系列map、混淆矩阵等图

（虽然yolov5默认有早停机制，但是是要再多训练100轮如果结果还是没改善才会自动停止）
先 终止训练
找到 run/train/exp（注意找对文件夹， exp是本轮训练时生成的文件夹）中的 opt.yaml文件，修改其中的 epochs为最近的一个比较大的数值，比如现在我训练到了169轮，我就先终止训练，然后将这个epochs改成了170，再将resume的default值改为True继续训练
如上，直接在 trainds.py设置参数 --resume的 defualt=True即可（在代码 517行附近）
训练完原有epoch，但还继续训练（与参考链接操作不同）

训练完原有epoch后，但还继续训练，比如设置epoch为200，已经训练完了，但是没有收敛等原因想使用训练了200 epoch的权重继续训练100个epoch，总共就是300个epoch

不是直接在train.py设置weight参数为训练好的权重（last.pt），然后设置epoch为100，这样不行，因为学习率等超参数启动时还是按照默认的。。。（自己把一些超参数设置好也可以，但感觉有点烦）
在train.py代码里面设置就可以使用原有200 epoch的权重后继续训练到300epoch

❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀

以训练了5个epoch后，想继续训练到15个epoch为例：

step1：
（同1.）先将 --resume的 defualt改为 True，再将 --epochs设为想要继续训练到的epochs，即 defualt=300（在trainds.py代码的513行附近）

parser.add_argument('--epochs', type=int, default=15)

step2：

在 trainds.py文件中，按下 Ctrl+F搜索 Epochs定位到大概200行的位置，做以下两处修改：

添加一行代码： ckpt['epoch'] = 5
修改代码： start_epoch = ckpt['epoch']（后面不加1）

注意：这两处修改是为了断点训练，如果不再需要断点训练，请将这两处修改都还原。

step3：

可以直接简化为下面的操作：

找到 run/train/exp（注意找对文件夹， exp是本轮训练时生成的文件夹）中的 opt.yaml文件，修改其中的 epochs为你想要改为的最大的epoch值

——————————–这个编辑代码的步骤可以省略了———————————————

在 trainds.py文件中，按下 Ctrl+F搜索 replace定位到大概565行的位置，做以下两处修改：

如图添加一行代码： init_epochs = opt.epochs（记录最开始由epochs参数设定的数值15，因为replace这行代码，将epochs替换成了原始的epochs数值5）
修改代码：如图进行添加，reinstate恢复成设定的epochs

—————————————————————————————————————–

🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍🙋‍

做完以上3个修改，训练就会从第5个epoch的基础上进行继续训练到15个epoch，和直接设置epoch为15一样

老师让我测试了一下： 这个继续训练对数据集发生变化的有效没有?
老师的解释：理论上应该是没有影响，虽然数据集变化，但训练只是沿用前面的权重表就可以，比如增加了训练数据应该没有问题

前5个epoch的数据集情况：总数为708张，按9:1划分得到 -> 训练集637张，验证集71张
继续训练到15个epoch的新数据集情况：总数为100张，按9:1划分得到 -> 训练集90张，验证集10张

👉经测试，是有效的，能够继续训练且正确，可参看以下3张图片：

Original: https://blog.csdn.net/LWD19981223/article/details/125887486
Author: 孟孟单单
Title: yolov5ds-断点训练、继续训练、先终止训练并调整最终epoch（yolov5同样适用）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/715639/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【简单模拟添加并合并通讯录~python+】

目录添加并合并通讯录 * 相关程序代码如下： – 运行效果如下： Pandas 每日一练： * 81、导入并查看pandas与numpy版本 – 运行结果…

人工智能 2023年7月16日
0068
【python三维深度学习】python三维点云从基础到深度学习

点云法向量、质心、体素、三角面。含数据与python源码。旋转、平移、立体几何投影理论分析、投影变换、仿射变换、缩放等，特别是包含了基于法向量的点云旋转，可以将激光雷达地面点云…

人工智能 2023年7月4日
0093
WebRTC中AECM算法简介

1，算法介绍以及整体框架 1.1算法整体框架 AECM 属于 WebRTC 语音处理引擎(Voice Engine)的子模块，是为移动设备专门设计的回声消除处理模块，其内部有根据芯…

人工智能 2023年5月25日
00137
python数据分析案例，心脏病预测

心脏病是一类比较常见的循环系统疾病。它作为全球第一大杀手，是我们不得不提前防御的疾病。我从kaggle上下载了一份心脏病数据集，利用python找出一些规律，看下哪些特征对于确诊心…

人工智能 2023年7月16日
0060
【毕业设计】天气预测与数据分析系统 – 机器学习 python

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月16日
0075
MindSpore分类指标之准确率、AUC/ROC详解（一）

一、评价指标基本概念评价指标是针对模型性能优劣的一个定量指标。一种评价指标只能反映模型一部分性能，如果选择的评价指标不合理，那么可能会得出错误的结论，故而应该针对具体的数据、模…

人工智能 2023年7月2日
0087
MongoDB安装教程

✅作者简介：大家好我是honker707,大家可以叫我honker，新星计划第三季python赛道Top1🥇🥇🥇📃个人主页：honker707的csdn博客🔥系列专栏：python…

人工智能 2023年7月29日
0068
机器学习——基于python的鸢尾花SVM练习（包含超参数批量筛选、交叉验证）

写在前面——虽然本人一直对机器学习感兴趣，但是一直没有动手实践，每次都是看一点入门就放弃了。现在因为课题需要，刚好可以边实践边学习。前面写了一个基于R语言的SVM练习，后来发现还是…

人工智能 2023年6月15日
0078
代码随想录算法训练营day53||1035.不相交的线||53. 最大子序和

思路：直线不能相交，就说明在字符串A中找到一个与字符串B相同的子序列，而且这个子序列不能改变相对顺序，只要相对顺序不改变，链接相同数字的直线就不会相交。 class Soluti…

人工智能 2023年6月30日
0093
Linux下安装支持h264的opencv

h264+opencv 写在前面安装x264 安装opencv 有可能出现的问题及解决方案： * E: Unable to locate package libjasper-de…

人工智能 2023年7月20日
0074
Pandas 判断一列是否包含某字符串

1.直接判断 my_df.loc[my_df[‘往来单位名称’].str.contains(‘en’), ‘客户类型’] = ‘国外客户’ 2.字符串截取一部分判断 my_df.l…

人工智能 2023年7月6日
0048
人工智能 | ShowMeAI资讯日报 #2022.06.24

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年7月18日
0087
【集成学习】：Stacking原理以及Python代码实现

Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原…

人工智能 2023年7月27日
0073
OpenCV+python实现摄像头简单手势识别–进度条控制亮度

文章目录前言一、整体框架二、使用步骤; * – 1.引入库; 2.第一步:打开摄像头; 3.第二步:设置回调函数; 4.第三步:肤色检测; 5.第四步:进行高斯滤…

人工智能 2023年7月18日
0054
汽车质心绝对加速度数学推导和滑模控制实例

1. 线性二自由度汽车质心绝对加速度在车辆坐标系下的公式在汽车线性二自由度微分方程那篇博客中，我具体推导了(a_y)，但是用了近似和忽略。下面将用向量的方法，详细推导出(a_x、…

人工智能 2023年6月4日
0069
行为识别方法简介

目录 1 背景介绍 2 方法 2.1 传统有监督特征提取方法 2.1.1 时空关键点(space-time interest points) 2.1.2 密集轨迹(dense-tr…

人工智能 2023年7月27日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

yolov5ds-断点训练、继续训练、先终止训练并调整最终epoch（yolov5同样适用）

目录

——————————–这个编辑代码的步骤可以省略了———————————————

—————————————————————————————————————–

大家都在看