【深度学习训练流程】浅析深度学习训练流程

2023年5月27日下午10:19 • 人工智能 • 阅读 88

深度学习训练流程是一套固定的模板

optimizer定义，选择不同的optimizer，权重衰减，梯度更新。
scheduler定义，选择不同的scheduler，进行学习率的更新。（可选，可不使用scheduler进行学习率更新，设为None，则学习率为恒定值）
model初始化，选择使用GPU训练还是CPU训练
loss选择优化函数，

for epoch in range(epochs):# &#x8BAD;&#x7EC3;&#x51E0;&#x4E2A;epoch
    for batch_data in range(train_data):
        # &#x6309;&#x7167;&#x4E8B;&#x5148;&#x5B9A;&#x4E49;batch&#x8FDB;&#x884C;shuffle&#x62BD;&#x53D6;&#x6570;&#x636E;&#xFF0C;&#x8F93;&#x5165;&#x6A21;&#x578B;&#x4E2D;&#x8BAD;&#x7EC3;
        loss = model(**batch_data)
        loss.backward() # &#x8FDB;&#x884C;&#x68AF;&#x5EA6;&#x53CD;&#x5411;&#x8BA1;&#x7B97;&#xFF0C;&#x66F4;&#x65B0;&#x6A21;&#x578B;&#x6240;&#x6709;&#x7684;&#x6743;&#x91CD;
        #&#x53EF;&#x9009; &#xFF0C;&#x68AF;&#x5EA6;&#x526A;&#x88C1;&#xFF0C;&#x9632;&#x6B62;&#x68AF;&#x5EA6;&#x7206;&#x70B8;
        torch.nn.utils.clip_grad_norm_(
                self.module.parameters(),
                grad_clip
            )
        optimizer.step() # &#x57FA;&#x4E8E;backward&#x7684;&#x68AF;&#x5EA6;&#xFF0C;&#x7EE7;&#x7EED;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x8BA1;&#x7B97;&#x3002;
        scheduler.step() # &#x66F4;&#x65B0;&#x5B66;&#x4E60;&#x7387;
        optimizer.zero_grad() # &#x5C06;&#x68AF;&#x5EA6;&#x6E05;&#x96F6;&#xFF0C;&#x9632;&#x6B62;&#x4E0A;&#x4E00;&#x4E2A;batch&#x7684;grad&#x5BF9;&#x5F53;&#x524D;batch&#x7684;&#x5F71;&#x54CD;  &#xFF08;&#x8FD9;&#x91CC;&#x6709;&#x65F6;&#x5019;&#x4F1A;&#x5199;&#x6210; model.zero_grad()&#xFF09;

model.zero_grad():
将所有模型参数的梯度置为0

optimizer.zero_grad():
清除所有优化的 torch.Tensor的梯度

详细请参考：

model.zero_grad() vs optimizer.zero_grad()

理解optimizer.zero_grad(), loss.backward(), optimizer.step()的作用及原理

详解torch.nn.utils.clip_grad_norm_ 的使用与原理

Original: https://blog.csdn.net/qq_36287702/article/details/123969131
Author: 桐原因
Title: 【深度学习训练流程】浅析深度学习训练流程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527883/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【双十一特辑】爱心代码（程序员的浪漫）-李峋

前言最近《点燃我温暖你》中李峋的爱心代码超级火，看着特别心动，这不，光棍节快到了，给兄弟们教学一波爱心代码，赶在双十一前表白，让这个双十一不在是孤单一个人！目录前言 C语言简…

人工智能 2023年6月26日
00126
【论文精读】Hi-Transformer 层次化和交互化的长文档建模

论文链接：https://aclanthology.org/2021.acl-short.107.pdf Hi-Transformer: Hierarchical In…

人工智能 2023年5月28日
00110
TensorFlow/PyTorch和cuda等版本对应关系

参考： NVIDIA系列显卡做深度学习,需要在主机安装显卡驱动(driver) 在docker中安装英伟达的科学计算库(cuda) 在python中安装深度学习库(pytorch…

人工智能 2023年5月26日
00107
公交车语音播报系统的使用说明书

先给各位父老乡亲问个好，这是本项目的最后一篇博客了，之所以没有坚持到每天更新一篇的任务达成，是因为整个调试过程不可谓不波折，少芯片的事情对于硬件工程师而言，太普遍了，这个项目走下来…

人工智能 2023年5月25日
00136
OpenCV基础操作_图片读取和保存

目录 1 图片读取 2 图片保存 1 图片读取在OpenCV中，加载图片采用imread（）函数。函数详细说明在：Reading and Writing Images and …

人工智能 2023年6月18日
00106
Pandas学习笔记

Pandas学习笔记导入库 import pandas as pd 读取文件数据 df = pd.read_csv("data/dogName.csv") S…

人工智能 2023年7月8日
00100
为什么回归直线过平均值点_如何理解线性回归方程？

下面是机器学习的《监督式学习》课程的一篇试读文章，进行了一下重新排版，然后展示在这里。由于格式的限制，缺少了一些习题、可运行的代码、证明、注释等，可能会导致解释差强人意，所以介意的…

人工智能 2023年6月18日
00117
【论文笔记】Modeling User Exposure in Recommendation

Modeling User Exposure in Recommendation 【论文作者】Dawen Liang, David M. Blei, etc. WWW’…

人工智能 2023年6月6日
0072
使用labelme以任意形状标注多个目标后将目标逐一抠图并保存到本地

1.使用labelme进行标注这里使用两张图片进行标注，需要注意以下几点： 1.图片的名称需要时英文字母命名； 2.标注目标的命名为类别. 标注完成直接将对应的json文件保存到…

人工智能 2023年7月19日
00114
基于MATLAB的简单手势识别

匆匆在看完了MOOC的《数字图像处理》，为了巩固所学，做了一个简单的手势识别（只能识别手势1、2、3）！ 0.1、MATLAB R2021b安装软件包下载地址微信公众号：小白课代…

人工智能 2023年6月18日
00101
Opencv学习（4）——图像梯度处理

图像梯度处理 Sobel算子 dst = cv2.Sobel(src,ddepth,dx,dy,ksize)src :需要处理的图片ddepth :图像的深度，一般为-1dx和dy…

人工智能 2023年7月18日
0061
用python爬取全国和全球疫情数据，并进行可视化分析(过程详细代码可运行)

用Python爬取最新疫情数据这次重大疫情，每时每刻数据都有可能变化，这篇博文将为大家讲解如何爬取实时疫情数据，并且分析数据，作出数据可视化的效果。报告梗概：对中国疫情分析 …

人工智能 2023年7月4日
00120
大数据之足球盘口赔率凯利必发数据采集爬虫

这期主要介绍足球类数据的获取即爬虫相关知识，主要是针对足球/体育类网站平台都爬虫工程师。如果您是单纯的进行数据分析，利用赔率、亚盘、凯利、必发等各指标找出与赛果的关系，可以通过网络…

人工智能 2023年6月19日
00154
傅立叶变换之（一）——欧拉公式

目录前言一、复数的概念？二、欧拉公式 * 2-1、虚数单位i 2-2、欧拉公式的定义 2-3、欧拉公式的描述总结前言这是一个系列笔记，在理解图卷积神经网络的时候需要用到…

人工智能 2023年6月15日
00113
Adam优化器（通俗理解）

网上关于Adam优化器的讲解有很多，但总是卡在某些部分，在此，我将部分难点解释进行了汇总。理解有误的地方还请指出。 Adam，名字来自： Adaptive Moment Estim…

人工智能 2023年7月29日
0069
睿智的目标检测54——Tensorflow2 搭建YoloX目标检测平台

睿智的目标检测54——Tensorflow2 搭建YoloX目标检测平台学习前言源码下载 YoloX改进的部分（不完全） YoloX实现思路 * 一、整体结构解析二、网络结构…

人工智能 2023年7月9日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【深度学习训练流程】浅析深度学习训练流程

大家都在看