深度学习回归任务要谨慎使用Dropout

2023年6月18日上午10:24 • 人工智能 • 阅读 111

于是，尝试把bert内部的dropout全部关掉，最终得到以下的一个loss，对比可得，这个loss下降就非常平稳，模型收敛。
可是，dropout相当于ensemble，能随机砍掉一些结果，按理应该是能够防止过拟合，增加模型稳健性得，为什么这里用了dropout反而性能损失这么大？

原文：
为什么回归问题不能用Dropout

; 二. 原因阐述

回顾dropout用法：

dropout在训练时会以 p 的概率将隐藏层的神经元设置为0，同时会将其他神经元乘以 1/1-p, 保证输出期望的一致性。

然后推导一下dropout输出值的均值和方差，可以发现其经过dropout后，
均值并没有发生变化，而方差发生了变化。

由于经过dropout的输出还要经过非线性层（比如Linear + ReLU），非线性层可以理解为把它输入的一个分布转换成另外一个分布（ReLU其实就相当于把小于0的部分全部砍掉了），那它输出的均值没有发生改变， 但是方差发生了变化，这个变化就会导致非线性层输出的均值发生偏移，最终导致整个网络的输出值发生偏移。

也就是说，如果使用了dropout，在训练时隐藏层神经元的输出的方差会验证时输出的方差不一致，这个方差的变化在经过非线性层的映射之后会导致输出值发生偏移，最终导致了在验证集的效果很差。

三. 总结

由于回归问题输出是一个绝对值，对这种变化就很敏感，但是分类问题输出只是一个相对的logit，对这种变化就没那么敏感，因此，在回归问题上最好可以少用dropout（看情况），而在分类问题上可以用dropout。

不过，根据上面的分析，其实dropout最好是不要加在网络的中间，在最后输出层前面加一般应该还是没问题的，不会有明显的性能损失，但也不会有提高，因此，回归任务要谨慎使用dropout。

四. 参考

Pitfalls with Dropout and BatchNorm in regression problems | by Søren Rasmussen | Towards Data Science
The Magic of No Dropout | Kaggle
(PDF) Effect of Dropout Layer on Classical Regression Problems

Original: https://blog.csdn.net/qq_53250079/article/details/127360816
Author: 磨人的Big_data
Title: 深度学习回归任务要谨慎使用Dropout

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/634597/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习模型计算量评价指标FLOPs, MACs, MAdds关系

在评价深度学习模型的大小和计算量时，经常使用的参数有：parameters, FLOPs, MACs, MAdds。除此以外，我们还经常见到MAC, FLOPS, GFLOPS, …

人工智能 2023年7月5日
0092
Day798.Java编译 -Java 性能调优实战

JVM即时编译器JIT，优化Java编译 Hi，我是 阿昌，今天学习记录的是关于 JVM即时…

人工智能 2023年6月27日
0067
【数据库】03——初级开发需要掌握哪些SQL语句

前言🍉 作者简介：半旧518，长跑型选手，立志坚持写10年博客，专注于java后端☕专栏简介：相当硬核，黑皮书《数据库系统概念》读书笔记，讲解：1.数据库系统的基本概念(数据库设…

人工智能 2023年7月18日
0061
Matlab图像处理（1）彩色图像转换为灰度图像（初学必看）

手把手教你用Matlab实现彩色图像转换为灰度图像 RGB = imread(‘F:/1/tuxiang.jpg’);%将图像读入工作区 Y = rgb2gray(RGB);%将图…

人工智能 2023年6月17日
00125
pytest+yaml设计接口自动化框架过程记录（一步一步记录如何设计，完结撒花），源码提供，视频教程

pytest+yaml设计接口自动化框架过程记录 * – 第三代框架使用教程，该框架比现在这个完善了很多 – 框架简介 – 框架运行演示和功能介…

人工智能 2023年7月3日
0065
tensorflow 以及keras常用API记录

tensorflow 常用API * – 1. Python 和 NumPy 实用程序(keras) – + 1.1 to_categorical + 1….

人工智能 2023年5月26日
0075
ModuleNotFoundError: No module named ‘tensorflow‘

ModuleNotFoundError: No module named ‘tensorflow’ ModuleNotFoundError: No modu…

人工智能 2023年6月25日
0063
OpenVINO: export failure: libpython3.9.so.1.0: cannot open shared object file: No such file or direc

下面这个问题十分奇怪，我使用几乎同样的配置，Ubuntu18.04平台，无论是使用python3.8还是3.9，也无论是使用base环境还是自己创建的环境，使用openvino-d…

人工智能 2023年7月28日
0064
案例1：人生重开模拟器（Python）——直接带你入门~

本案例——人生重开模拟器，主要的目的就是熟悉和掌握基础语法（不涉及def定义函数）的基本操作~~ 一、下面是本系统用到的主要语法：基础语法（一）：常量、变量、类型（整数，浮点数…

人工智能 2023年7月3日
0080
当前主流目标识别（Object Detection）算法

目标识别（Object Detection）就是从图像/视频之中识别出用户感兴趣的目标，反馈目标的位置和类别。目前主流的目标识别技术方案包括R-CNN，YOLO，SSD等，新的算法…

人工智能 2023年7月9日
0067
Paper Reading – 综述系列 – Hyper-Parameter Optimization（上）

更多可见计算机视觉-Paper&Code – 知乎自开发深度神经网络以来，几乎在日常生活的每个方面都给人类提供了比较理性的建议。但是，尽管取得了这一成就，神经…

人工智能 2023年6月23日
0082
第11章：图像金字塔

第11章：图像金字塔 * – 一、理论基础： – + 1. 向下采样： + 2. 向上采样： – 二、pyrDown函数使用： – …

人工智能 2023年6月19日
00109
PLC如何实现二阶滤波器算法(二阶巴特沃斯低通滤波器FIR_Filter)

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月27日
0071
对抗学习概念、基本思想、方法综述

代码实现篇对抗学习常见方法代码实现篇对抗学习的基本概念要认识对抗训练，首先要了解 “对抗样本”，在论文 Intriguing properties o…

人工智能 2023年6月13日
0057
初入深度学习2——如何使用一个深度学习库

初入深度学习2——如何使用一个深度学习库学习前言使用一个深度学习仓库 * 一、环境配置 – 1、仓库包含requirements.txt 2、仓库不包含requir…

人工智能 2023年6月23日
0084
备忘录 | LAMMPS coding tips分子动力学软件LAMMPS的代码小技巧和注意事项

烦请收藏，后续会更新哦。有任何问题欢迎留言（虽然我也不一定能回答吧，但是万一呢）~ 命令太长可以用 & 换行显示；注意output files命名，避免重名，尤其是多个算…

人工智能 2023年5月25日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习回归任务要谨慎使用Dropout

目录

大家都在看