Pytorch model.eval()的作用

2023年6月24日上午6:58 • 人工智能 • 阅读 91

使用pytorch训练和预测时会分别使用到以下两行代码：

model.train()
model.eval()

后来想了解model.eval()的具体作用，在网上查找资料大都是以下原因：
模型中有BatchNormalization和Dropout，在预测时使用model.eval()后会将其关闭以免影响预测结果。

但是没有找到BN和Dropout是具体如何影响预测结果的，直到看到这篇博客中的内容才有所理解，个人理解如下：
1） 训练过程中BN的变化。
在训练过程中BN会不断的计算均值和方差，训练结束后得到最终的均值和方差，在此处将其记为mean_train，variance_train。

2） 预测过程中BN的变化。
预测过程中如果不使用model.eval()的话，BN层还是会根据输入的预测数据继续计算均值和方差，假设输入一条预测数据后，BN层计算得到其均值和方差分别为mean_test，variance_test，此时BN层的均值和方差则变成了(mean_train+mean_test),(variance_train+variance_test)，相比于训练过程中的均值和方差发生了变化因此会导致预测结果发生变化。

如果使用model.eval()则BN层就不会再计算预测数据的均值和方差，即在预测过程中BN层的均值和方差就是训练过程得到的均值和方差mean_train，variance_train，此时预测结果就不会再发生变化。

3） 训练过程中Dropout的变化
训练过程中依据设置的dropout比例会使一部分的网络连接不进行计算。

4） 预测过程中Dropout的变化
预测过程中如果不使用model.eval()的话，依然会使一部分的网络连接不进行计算，而使用model.eval()后就是所有的网络连接均进行计算。

Original: https://blog.csdn.net/libaominshouzhang/article/details/119741474
Author: 嘿，兄弟，好久不见
Title: Pytorch model.eval()的作用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/648636/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

nn.Identity()

nn.Identity() 是个函数，不是矩阵！恒等函数 f ( x ) = x f(x)=x f (x )=x罢了 nn.Identity will just return it…

人工智能 2023年6月16日
0065
【自然语言处理】【聚类】基于神经网络的聚类算法DEC

一、简介聚类特别依赖特征空间的选择；先前很少有研究来解决用于聚类的特征空间学习问题；本文提出了一种称为Deep Embedded Clustering(DEC) \text{…

人工智能 2023年5月30日
0091
web网页设计实例作业HTML+CSS+JavaScript蔬菜水果商城购物设计

常见网页设计作业题材有个人、美食、公司、学校、旅游、电商、宠物、电器、茶叶、家居、酒店、舞蹈、动漫、服装、体育、化妆品、物流、环保、书籍、婚…

人工智能 2023年6月27日
00108
ROS图像的Deeplab v3+实时语义分割（ROS+Pytorch）

目录写在前面测试环境主要思路正式开始 * 代码获取代码编译代码使用结果展示写在前面做机器人的同学们应该都知道，ROS是最常用的系统。一般搭载在机器人上的传感器也通…

人工智能 2023年6月10日
00112
Tensorflow2.0学习-加载和预处理数据 (七)

import tensorflow as tf AUTOTUNE = tf.data.experimental.AUTOTUNE 数据准备 import pathlib data_…

人工智能 2023年5月24日
00102
LESSON 9.1 随机森林回归器的实现

目录三随机森林RandomForest1 RamdomForestRegressor的实现2 随机森林回归器的参数2.1 弱分类器结构2.2 弱分类器数量2.3 弱分类器训练的数…

人工智能 2023年6月17日
0055
为了摸鱼，我开发了一个工具网站

🏡 博客首页：派大星⛳️ 欢迎关注 🐳 点赞 🎒 收藏 ✏️ 留言🎢 本文由派大星原创编撰🚧 系列专栏：《开源专栏》🎈 本系列主要输出作者自创的开源项目🔗 作品：www.jso…

人工智能 2023年7月31日
0066
Opencv之图像入门

Opencv基础操作之图像入门 1.利用Opencv进行图像的读取和保存 * 1.1图像读取 1.2 图像保存 2.使用Matplotlib显示图像 3.总结 1.利用Opencv…

人工智能 2023年6月22日
0084
目前UI设计薪资待遇怎么样？工作好找吗？

UI设计的火爆，导致有很多年轻人都愿意投身于这个行业。有很多年轻的朋友都在问，UI设计的薪资待遇怎么样？工作难找吗？本文统一解答一下。 1、UI设计的薪资水平 UI设计的薪资待遇一…

人工智能 2023年7月30日
0073
机器学习03：使用logistic回归方法解决猫狗分类问题

机器学习03：使用logistic回归方法解决猫狗分类问题文章目录机器学习03：使用logistic回归方法解决猫狗分类问题 * – 前言 1. Logistic回…

人工智能 2023年7月2日
0063
Haar分类器学习笔记

Haar分类器是什么？ Haar分类器 = Haar-like 特征 + 积分图 + AdaBoost + 强分类器的级联 1、Haar-like 特征最基本的Haar-like特…

人工智能 2023年7月1日
0066
【知识图谱】基于电影数据构建演员、电影、类型的知识图谱

项目地址在我的github: movie_kg 效果： ; 过程： 0.依赖 mysql 8.0 navicat 11 jdk 1.8 neo4j 3.5 1.数据处理 [注意：也…

人工智能 2023年6月1日
0078
Faster-RCNN详解（个人理解）

1. Faster RCNN的四个主要内容图1 Faster-RCNN基本结构如上图所示，整个Faster RCNN模型可以分为四个模块： 1） Conv layers ，特征…

人工智能 2023年6月22日
0069
知识图谱学习笔记1

参考 https://blog.csdn.net/pelhans/category_7607589.html 知识图谱-给AI装个大脑 – 知乎知识图谱的定义 &#8…

人工智能 2023年6月1日
0068
强化学习(一)：简介——什么是强化学习？

本文将介绍强化学习的基本含义，了解什么是强化学习、强化学习的概念与基本框架以及强化学习中常见的问题类型。 ; 什么是强化学习？强化学习（Reinforcement Learnin…

人工智能 2023年6月19日
0070
SHU语义网与知识图谱

SHU语义网与知识图谱文章目录 SHU语义网与知识图谱 * 前言课程笔记 – 第一讲：语义网概述第二讲：RDF和RDFs + RDF部分 RDFs及其形式语义第…

人工智能 2023年6月10日
0066

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pytorch model.eval()的作用

大家都在看