「解析」正则化 DropPath

2023年7月21日下午10:16 • 人工智能 • 阅读 57

DropPath 类似于Dropout，不同的是 Drop将深度学习模型中的多分支结构随机 “失效”
而Dropout 是对神经元随机 “失效”

1、DropPath在网络中的应用

假设在前向传播中有如下的代码：

x = x + self.drop_path( self.conv(x) )

那么在drop_path分支中，每个batch有drop_prob的概率样本在 self.conv(x) 不会 “执行”，会以0直接传递。

若x为输入的张量，其通道为[B,C,H,W]，那么drop_path的含义为在一个Batch_size中，随机有drop_prob的样本，不经过主干，而直接由分支进行恒等映射。

⚠️注意：Drop Path不能直接这样使用：
x = self.drop_path(x)

2、DropPath实现

def drop_path(x, drop_prob: float = 0., training: bool = False, scale_by_keep: bool = True):
    """Drop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).

    This is the same as the DropConnect impl I created for EfficientNet, etc networks, however,
    the original name is misleading as 'Drop Connect' is a different form of dropout in a separate paper...

    See discussion: https://github.com/tensorflow/tpu/issues/494#issuecomment-532968956 ... I've opted for
    changing the layer and argument names to 'drop path' rather than mix DropConnect as a layer name and use
    'survival rate' as the argument.

"""
    if drop_prob == 0. or not training:
        return x
    keep_prob = 1 - drop_prob
    shape = (x.shape[0],) + (1,) * (x.ndim - 1)
    random_tensor = x.new_empty(shape).bernoulli_(keep_prob)
    if keep_prob > 0.0 and scale_by_keep:
        random_tensor.div_(keep_prob)
    return x * random_tensor

class DropPath(nn.Module):
    """Drop paths (Stochastic Depth) per sample  (when applied in main path of residual blocks).

"""
    def __init__(self, drop_prob=None, scale_by_keep=True):
        super(DropPath, self).__init__()
        self.drop_prob = drop_prob
        self.scale_by_keep = scale_by_keep

    def forward(self, x):
        return drop_path(x, self.drop_prob, self.training, self.scale_by_keep)

torch.bernoulli(input, *, generator=None, out=None)

>>> a = torch.empty(3, 3).uniform_(0, 1)
>>> a
tensor([[ 0.1737,  0.0950,  0.3609],
        [ 0.7148,  0.0289,  0.2676],
        [ 0.9456,  0.8937,  0.7202]])
>>> torch.bernoulli(a)
tensor([[ 1.,  0.,  0.],
        [ 0.,  0.,  0.],
        [ 1.,  1.,  1.]])

从伯努利分布中提取二进制随机数（0或1）。
输入张量应该是一个包含用于绘制二进制随机数的概率的张量。因此，输入中的所有值必须在以下范围内：0 ≤ i n p u t i ≤ 1 0≤input_i≤1 0 ≤i n p u t i ≤1

o u t i ∼ B e r n o u l l i ( p = i n p u t i ) \mathrm{out_i ∼Bernoulli}( p= \mathrm{input_i} )o u t i ∼B e r n o u l l i (p =i n p u t i )

The returned out tensor only has values 0 or 1 and is of the same shape as input.

out can have integral dtype, but input must have floating point dtype

用均匀分布中提取的值填充输入张量 U ( a , b ) U(a,b)U (a ,b )

torch.nn.init.uniform_(tensor, a=0.0, b=1.0)

>>> a = torch.empty(3, 3)
>>> a
tensor([[0.0000e+00, 1.5846e+29, 0.0000e+00],
        [1.5846e+29, 9.8091e-45, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00]])

>>> a.uniform_(0,1)
tensor([[0.0876, 0.5072, 0.4613],
        [0.7696, 0.4485, 0.1128],
        [0.2512, 0.8060, 0.6595]])

>>> a.bernoulli_()
tensor([[1., 1., 1.],
        [1., 0., 0.],
        [1., 0., 0.]])

将输入的每个元素除以另一个元素的对应元素。

torch.div(input, other, *, rounding_mode=None, out=None)

>>> x = torch.tensor([ 0.3810,  1.2774, -0.2972, -0.3719,  0.4637])
>>> torch.div(x, 0.5)
tensor([ 0.7620,  2.5548, -0.5944, -0.7438,  0.9274])

>>> a = torch.tensor([[-0.3711, -1.9353, -0.4605, -0.2917],
...                   [ 0.1815, -1.0111,  0.9805, -1.5923],
...                   [ 0.1062,  1.4581,  0.7759, -1.2344],
...                   [-0.1830, -0.0313,  1.1908, -1.4757]])
>>> b = torch.tensor([ 0.8032,  0.2930, -0.8113, -0.2308])
>>> torch.div(a, b)
tensor([[-0.4620, -6.6051,  0.5676,  1.2639],
        [ 0.2260, -3.4509, -1.2086,  6.8990],
        [ 0.1322,  4.9764, -0.9564,  5.3484],
        [-0.2278, -0.1068, -1.4678,  6.3938]])

o u t i = i n p u t i o t h e r i out_i = \frac{input_i}{other_i}o u t i =o t h e r i i n p u t i

3、参考

Original: https://blog.csdn.net/ViatorSun/article/details/122947859
Author: ViatorSun
Title: 「解析」正则化 DropPath

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707888/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NLP-文本处理：指代消解（Coreference Resolution）【回指消解（名词＜–＞代词）、共指消解（名词1＜–＞名词2）】【识别指向同一实体的不同表述】【难度较大，准确率不会太高】

共指消解（coreference resolution）技术同NER、RE。作为自然语言历届基础技术被广泛的应用于：文本摘要、机器翻译、自动问答和知识图谱等领域。共指消解的提出是…

人工智能 2023年6月10日
0074
数据分析大作战，SQL V.S. Python，来看看这些考题你都会吗 ⛵

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 本文地址：https://www.showm…

人工智能 2023年6月11日
0081
5分钟 NLP系列 — SentenceTransformers 库介绍

SentenceTransformers 是一个可以用于句子、文本和图像嵌入的Python库。可以为 100 多种语言计算文本的嵌入并且可以轻松地将它们用于语义文本相似性、语义搜…

人工智能 2023年7月12日
0064
机器学习感知机原理及python代码实现

感知机是二分类的线形分类模型。其输入为实例的特征向量，输出为实例的类别，取+1或-1二值。感知机对应于输入空间（特征空间）中将实例划分为正负两类的超平面，属于判别类型 2.1 感知…

人工智能 2023年6月16日
0082
YOLOv5、YOLOX、YOLOv6的分析与比较

美团的技术团队在最近提出了YOLOv6网络模型，美团在技术文档中重点对比了前两代的YOLOv5和YOLOX，以及百度的PP-YOLOE，在对coco数据集的验证中，YOLOv6不仅…

人工智能 2023年7月25日
00107
3D object detection 论文、代码和数据集汇总

文章目录 2019 * CubeSLAM: Monocular 3D Object SLAM (多模态)MVX-Net: Multimodal VoxelNet for 3D Ob…

人工智能 2023年7月9日
0056
【深度学习】【TensorFlow 】查看Tensorflow和python对应版本、将现有的TensorFlow更新到指定的版本

【深度学习】【TensorFlow 】查看Tensorflow和python对应版本、将现有的TensorFlow更新到指定的版本 1、查看Tensorflow和python对应版…

人工智能 2023年5月25日
0084
论文学习：基于多Agent的联合作战任务调度方法研究

目录 1.作战使命-任务-动作关系图 2.任务调度的意义 3.作战任务清单所包含的内容 4.多Agent系统任务调度的研究工作总结 5.Agent模型 6.多Agent系统 7.A…

人工智能 2023年6月1日
0087
【OpenCV】红绿灯识别检测

目录一：红绿灯识别检测效果展示二：红绿灯识别检测具体步骤 1.初始化设置，对亮度设置视频路径进行初始化设置 2.帧处理，调整视频亮度，分解YCrCb的三个成分，拆分红和绿，…

人工智能 2023年6月19日
0082
Pandas groupby在多个列中使用max获取行

正在查找在多个列中具有最大值的组的行： pd.DataFrame([{‘grouper’: ‘a’, ‘col1&#82…

人工智能 2023年7月7日
0067
仅有0.1M可训参数，AIOps日志异常检测新范式

论文精华解读 | 第一期推荐阅读 13min 学术论坛第一期活动举办后，我们收到了很多大家对云智慧公开的《TransLog: A Unified Transformer-bas…

人工智能 2023年5月31日
0078
Python数据科学库04(pandas)

Python数据科学库04(pandas) 学习04 numpy能够帮助我们处理数值，但是pandas除了处理数值之外(基于numpy)，还能够帮助我们处理其他类型的数据。 pan…

人工智能 2023年7月6日
0066
基于MATLAB的图像去遮挡修复数字图像处理系统

资源下载地址：https://download.csdn.net/download/sheziqiong/85639467 一、总述本次设计要求将图片前景的黑色栏杆去除，恢复遮挡…

人工智能 2023年6月20日
0087
时间序列回归：EAP.time_series_regress

实证资产定价中的时间序列回归多用于估计资产的因子暴露（beta值）。此外，时间序列分析可以通过GRS检验来考察资产收益率是否存在未被风险因子（risk factor）解释的异象（a…

人工智能 2023年6月18日
0089
呼叫中心的实时语音分析

呼叫中心的实时语音分析 CUSTOMER VOICE ANALYSIS AND AI 客户语音分析和人工智能 Media Stream创造了一种相对简单的方法，使其客户可以在其呼叫…

人工智能 2023年5月30日
0085
数据挖掘流程梳理

理解业务与数据一个好的数据挖掘必须去理解业务，对业务好的理解能够帮助你选择合适的数据、合适的算法去训练，得到更好的结果数据准备数据准备是基于原始数据，去构建数据挖掘模型所需的…

人工智能 2023年7月16日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

「解析」正则化 DropPath

1、DropPath在网络中的应用

2、DropPath实现

3、参考

大家都在看