【Pytorch】model.train() 和 model.eval() 原理与用法

2023年6月12日下午9:34 • 人工智能 • 阅读 69

pytorch可以给我们提供两种方式来切换训练和评估(推断)的模式，分别是： model.train() 和 model.eval()。

一般用法是：在训练开始之前写上 model.trian() ，在测试时写上 model.eval() 。

1. model.train()

在使用 pytorch 构建神经网络的时候，训练过程中会在程序上方添加一句model.train()，作用是 启用 batch normalization 和 dropout 。

如果模型中有BN层（Batch Normalization）和 Dropout ，需要在 训练时 添加 model.train()。

model.train() 是保证 BN 层能够用到 每一批数据 的均值和方差。对于 Dropout，model.train() 是 随机取一部分 网络连接来训练更新参数。

2. model.eval()

model.eval()的作用是 不启用 Batch Normalization 和 Dropout。

如果模型中有 BN 层（Batch Normalization）和 Dropout，在 测试时 添加 model.eval()。

model.eval() 是保证 BN 层能够用 全部训练数据 的均值和方差，即测试过程中要保证 BN 层的均值和方差不变。对于 Dropout，model.eval() 是利用到了所有网络连接，即不进行随机舍弃神经元。

训练完 train 样本后，生成的模型 model 要用来测试样本了。在 model(test) 之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。这是 model 中含有 BN 层和 Dropout 所带来的的性质。

eval() 时，pytorch 会自动把 BN 和 DropOut 固定住，不会取平均，而是用训练好的值。
不然的话，一旦 test 的 batch_size 过小，很容易就会被 BN 层导致生成图片颜色失真极大。
eval() 在非训练的时候是需要加的，没有这句代码，一些网络层的值会发生变动，不会固定，你神经网络每一次生成的结果也是不固定的，生成质量可能好也可能不好。

也就是说，测试过程中使用model.eval()，这时神经网络会 沿用 batch normalization 的值，而并 不使用 dropout。

3. 总结与对比

如果模型中有 BN 层(Batch Normalization）和 Dropout，需要在训练时添加 model.train()，在测试时添加 model.eval()。

其中 model.train() 是保证 BN 层用每一批数据的均值和方差，而 model.eval() 是保证 BN 用全部训练数据的均值和方差；

而对于 Dropout，model.train() 是随机取一部分网络连接来训练更新参数，而 model.eval() 是利用到了所有网络连接。

dropout 常常用于抑制过拟合。

设置Dropout时，torch.nn.Dropout(0.5)，这里的 0.5 是指该层（layer）的神经元在每次迭代训练时会随机有 50% 的可能性被丢弃（失活），不参与训练。也就是将上一层数据减少一半传播。

Original: https://blog.csdn.net/weixin_44211968/article/details/123774649
Author: 想变厉害的大白菜
Title: 【Pytorch】model.train() 和 model.eval() 原理与用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/605437/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【数据科学项目02】：NLP应用之垃圾短信/邮件检测（端到端的项目）

垃圾短信检测（端到端的项目）我们都听说过一个流行词—— “数据科学”。我们大多数人都对”它是什么？我可以成为数据分析师或数据科学家吗？我需要什…

人工智能 2023年6月23日
0063
机器学习笔记 – 特征向量和特征值

一、特征向量和特征值 1、概念简述和应用（1）概念简述矩阵的特征向量是矩阵理论上的重要概念之一，它有着广泛的应用。特征值和特征向量是数据科学领域的核心。它到底有什么用？简而…

人工智能 2023年6月15日
00102
注意力机制——Coordinate Attention

目录摘要 1 介绍 2 相关工作 2.1 Mobile Network 2.2 注意力机制 3 Coordinate Attention 3.1 Revisit SE Block…

人工智能 2023年5月26日
0080
[Tool] Git 使用与 Git Flow

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月27日
0096
【TorchScript】PyTorch模型转换为C++的Libtorch模型

任务简介：使用PyTorch训练的模型只能在Python环境中使用，在自动驾驶场景中，模型推理过程通常是在硬件设备上进行。TorchScript可以将PyTorch训练的模型转换…

人工智能 2023年7月22日
0041
基于python的卷积神经网络,Python实现卷积神经网络

怎样用python构建一个卷积神经网络模型上周末利用python简单实现了一个卷积神经网络，只包含一个卷积层和一个maxpooling层，pooling层后面的多层神经网络采用了…

人工智能 2023年6月16日
0074
【Python】第七篇：模块化编程及第三方模块的安装

💖少年遥想得山田，请赶在日暮下山💖 系列文章目录🍁 第一篇：基础语法与结构整理万字，秃头的路上，我们一起成为卷王第二篇：Python四大内置数据结构列表、字典、元组、集合看这一篇…

人工智能 2023年7月5日
0067
PyTorch环境搭建、安装过程以及卸载(anaconda+清华镜像+安装pyTorch）

本文介绍基于Anaconda环境以及PyCharm软件结合，安装PyTorch深度学习框架。一. 安装anaconda 此处默认已经安装好了anaconda.(也可以去anaco…

人工智能 2023年6月23日
0079
ci发什么音标_语音识别科普篇-术语定义-音素/音节/音标

一.音素和国际音标 1．什么是音素（phone）：音素是语音的最小单位。音素是根据语音的自然属性划分出来的最小语音单位。从声学性质来看，音素是从音质角度划分出来的最小语音单位。从…

人工智能 2023年5月27日
0084
Python+tushare+talib+mplfinance制作股票K线条和技术指标

开发平台 Anaconda Navigator (Anaconda3) Jupyter 所用到库 import mplfinance as mpf import tushare a…

人工智能 2023年7月7日
0072
阿里云机器学习平台PAI之分类实践

💜这篇博客是机器学习PAI的实践部分，主要演示的是分类算法在平台上的使用方法，对往期内容感兴趣的小伙伴可以查看一下内容👇: hadoop专题:hadoop系列文章. spark专题…

人工智能 2023年7月1日
0084
SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame

首先咱们来了解一下，df对象的切片操作，这里我就简单举例两种：df.loc[] df[] df对象是二维的，所以我们在切片的时候一般会取两列索引 import pandas as …

人工智能 2023年7月8日
0058
【深度学习前沿应用】图像风格迁移

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月4日
0052
Pandas实用技能，将列（column）排序的几种方法

来源：Python数据之道 (ID:PyDataLab)作者：阳哥大家好，我是阳哥。 Pandas 可以说是在Python数据科学领域应用最为广泛的工具之一。 Pandas是一…

人工智能 2023年6月19日
0089
Pandas高级教程之:Dataframe的重排和旋转

文章目录简介使用Pivot 使用Stack 使用melt 使用Pivot tables 使用crosstab get_dummies 简介使用Pandas的pivot方法可以…

人工智能 2023年7月8日
0075
【树莓派】USB摄像头+python+opencv

一、接入USB摄像头插入usb摄像头，在命令行模式下输入 lsusb 如果看到列举出来的信息有camera的话就说明识别成功，可以使用。二、测试摄像头 1、拍照测试安装 fs…

人工智能 2023年6月19日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch】model.train() 和 model.eval() 原理与用法

1. model.train()

2. model.eval()

3. 总结与对比

大家都在看