深度学习中Dropout层作用

2023年6月13日上午1:58 • 人工智能 • 阅读 80

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、dropout是什么？
二、dropout过程
三、dropout在神经网络中的过程

前言

Dropout出现的原因
训练深度神经网络的时候，总是会遇到两大问题：（1）容易过拟合（2）网络费时

在机器学习的模型中，如果模型的参数太多，而训练样本又太少，训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题，过拟合具体表现在：模型在训练数据上损失函数较小，预测准确率较高；但是在测试数据上损失函数比较大，预测准确率较低。Dropout可以比较有效的缓解过拟合的发生，在一定程度上达到正则化的效果。

过拟合是很多机器学习的通病。如果模型过拟合，那么得到的模型几乎不能用。为了解决过拟合问题，一般会采用模型集成的方法，即训练多个模型进行组合。此时，训练模型费时就成为一个很大的问题，不仅训练多个模型费时，测试多个模型也是很费时。

一、dropout是什么？

Dropout可以作为训练深度神经网络的一种trick供选择。在每个训练批次中，通过忽略一半数量的特征检测器（让一半的隐层节点值为0），可以明显地减少过拟合现象。这种方式可以减少特征检测器（隐层节点）间的相互作用，检测器相互作用是指某些检测器依赖其他检测器才能发挥作用。

保证稀疏性：

Dropout说的简单一点就是：我们在前向传播的时候，让某个神经元的激活值以一定的概率p（伯努利分布）停止工作，这样可以使模型泛化性更强，因为它不会太依赖某些局部的特征，如下图所示。

那么为什么可以防止过拟合呢？

（1）取平均的作用：先回到标准的模型即没有dropout，我们用相同的训练数据去训练5个不同的神经网络，一般会得到5个不同的结果，此时我们可以采用 “5个结果取均值”或者”多数取胜的投票策略”去决定最终结果。例如3个网络判断结果为数字9,那么很有可能真正的结果就是数字9，其它两个网络给出了错误结果。这种”综合起来取平均”的策略通常可以有效防止过拟合问题。因为不同的网络可能产生不同的过拟合，取平均则有可能让一些”相反的”拟合互相抵消。dropout掉不同的隐藏神经元就类似在训练不同的网络，随机删掉一半隐藏神经元导致网络结构已经不同，整个dropout过程就相当于对很多个不同的神经网络取平均。而不同的网络产生不同的过拟合，一些互为”反向”的拟合相互抵消就可以达到整体上减少过拟合。

（2）减少神经元之间复杂的共适应关系：因为dropout程序导致两个神经元不一定每次都在一个dropout网络中出现。这样权值的更新不再依赖于有固定关系的隐含节点的共同作用，阻止了某些特征仅仅在其它特定特征下才有效果的情况。迫使网络去学习更加鲁棒的特征，这些特征在其它的神经元的随机子集中也存在。换句话说假如我们的神经网络是在做出某种预测，它不应该对一些特定的线索片段太过敏感，即使丢失特定的线索，它也应该可以从众多其它线索中学习一些共同的特征。从这个角度看dropout就有点像L1，L2正则，减少权重使得网络对丢失特定神经元连接的鲁棒性提高。

（3）Dropout类似于性别在生物进化中的角色：物种为了生存往往会倾向于适应这种环境，环境突变则会导致物种难以做出及时反应，性别的出现可以繁衍出适应新环境的变种，有效的阻止过拟合，即避免环境改变时物种可能面临的灭绝。

(4) 增加稀疏性
但当数据量小的时候，可以通过稀疏性，来增加特征的区分度。

; 二、dropout过程

1）首先随机（临时）删掉网络中一半的隐藏神经元，输入输出神经元保持不变（上图中虚线为部分临时被删除的神经元）。
2）然后把输入x通过修改后的网络前向传播，然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后，在没有被删除的神经元上按照随机梯度下降法更新对应的参数（w，b）。
3）然后继续重复这一过程：

Original: https://blog.csdn.net/PETERPARKERRR/article/details/121888093
Author: UncleDrew_lsy
Title: 深度学习中Dropout层作用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/606036/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据分析——随机森林解决分类问题

根据轴承振动数据预测轴承故障，轴承振动数据一共有792组，每组数据包括6000个时间点的振幅。轴承标签数据一共有10类，0表示无故障，1~9分别表示不同的故障。百度网盘下载训练数据…

人工智能 2023年7月2日
0071
Python中pandas合并DataFramepd.merge()方法

选择题以下关于pd.merge()方法说法错误的是? A 若缺省how参数：用内连接的方式合并B 若缺省how参数：用外连接的方式合并C how=left：用左连接的方式合并D h…

人工智能 2023年7月7日
0080
基于python的AI五子棋实现（极大极小值搜索和alpha beta剪枝）

1.极大极小值搜索介绍人机博弈是人工智能的重要分支，人们在这一领域探索的过程中产生了大量的研究成果，而极小化极大算法(minimax)是其中最基础的算法，它由Shannon在19…

人工智能 2023年7月27日
0079
【python绘图】Matplotlib绘图及设置（使用python制图）

目录一、初识matplotlib.pyplot 1.绘制图像 2.设置图片大小 3.保存图片文件 4.设置X，Y轴刻度范围自定义刻度内容 5.添加描述信息（标题、轴标签） 6….

人工智能 2023年7月3日
0090
分类模型训练完之后，测试效果极差可能原因分析

在知乎上有这样一个问题： acc很高，但预测正确的样本占比又很低，怎么回事？ – 知乎关于这个问题，在这个问题的回答中，有许多大佬从数据的分布、模型的结构、数据集的划…

人工智能 2023年6月30日
00108
夜间灯光数据简介与下载链接

夜间灯光数据可以被用来研究人类活动的空间分布，例如能源消费模式、勾勒城市边界，很多研究表明灯光的面积或亮度与人口密度、GDP、能源消耗、碳排放、贫困分布、不透水表面密度分布图、粮食…

人工智能 2023年7月18日
0078
生成扩散模型漫谈：DDIM = 高观点DDPM

©PaperWeekly 原创 · 作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络相信很多读者都听说过甚至读过克莱因的《高观点下的初等数学》[1] 这套书，…

人工智能 2023年7月26日
0052
【Python程序设计】网络爬虫与自动化

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月27日
0069
【图像分割】基于粒子群优化模糊聚类算法实现图像分割matlab代码

1 简介基于粒子群优化的改进模糊聚类图像分割算法将微粒群搜索聚类中心作为图像分割的聚类初值,克服了FCM分割算法对聚类中心初值敏感的缺点,大幅提高了图像分割算法的计算速度。改进的…

人工智能 2023年6月2日
0076
【神经网络笔记】——多分类交叉熵损失函数公式及代码实现

背景 mse均方误差、mae绝对值平均误差用于拟合回归，公式已经熟悉了，但交叉熵的每次都只是应用，没有了解公式，这对于自己写交叉熵损失函数以及分析损失函数不利。公式详解 C是损失…

人工智能 2023年7月14日
0074
聚类算法评价指标之DBI指数及Python实现

目录 1.概念介绍 2.具体计算步骤 3.Python实现参考资料：https://blog.csdn.net/weixin_46713695/article/details/1…

人工智能 2023年6月15日
00123
高斯滤波(Gauss filtering)

1.概念介绍高斯滤波是一种 线性平滑滤波，适用…

人工智能 2023年7月19日
0072
ubuntu部署deepsort目标跟踪算法，无人车/无人机应用

🍉1、算法简介 DeepSort是对Simple Online and Realtime Tracking（ Sort）的扩展，它通过预先训练的深度关联度量来整合外观信息。使用视觉…

人工智能 2023年7月10日
0063
策略即代码如何帮助防止云配置错误

策略即代码通过智能安全策略自动化帮助防止云配置错误。每当基础架构或应用程序的设置方式出现错误时，就会发生这些错误配置。它们可以显着影响组织的云资源和整体 IT 基础架构的运行方式，…

人工智能 2023年6月30日
0085
蓝牙耳机推荐哪个好？盘点2021口碑最好的耳机品牌

蓝牙耳机在过去的两年里非常流行。相信我不用说了，很多人买它不仅是为了听音乐，也是为了穿戴的装饰。但也有很大一部分比较严谨，更注重音质、续航、性价比等，但对于刚接触蓝牙耳机的朋友来说…

人工智能 2023年5月25日
0072
conda 安装pytorch

配置：win 10或Ubuntu 下都通用 , 假设 python=3.6pytorch cuda torchvision 三个版本需要匹配的，对于pytorch 和torchvi…

人工智能 2023年7月22日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习中Dropout层作用

文章目录

大家都在看