GLU（Gated Linear Unit，门控线性单元）简介

2023年6月16日下午5:24 • 人工智能 • 阅读 233

前言

简单介绍门控线性单元的结构。

原始论文

《Language Modeling with Gated Convolutional Networks》提出GLU，2017年（第一版是2016年）

网络结构

下图的结构只是其中一层，可以堆叠。

; 计算公式

每一层的计算公式如下。

其中：
X代表输入。
W、V、b、c都是要学习的参数。
σ \sigma σ在原论文中是 sigmoid函数。
⊗是对应元素相乘（element-wise product），也称为哈达玛积(Hadamard product)。

从公式可以看到，输入X分两路，其中一路的运算结果不做处理，另一路则经过激活函数。

Pytorch文档

torch.nn.GLU(dim=-1)

GLU(a,b)=a⊗σ(b)

（先随便读一下文档，后面有代码示例和详细解释）

参数
dim (int) – the dimension on which to split the input. Default: -1
指定从哪个维度对input进行拆分，默认值：-1

参数形状
Input: (∗1,N,∗2) where * means, any number of additional dimensions
Output: (∗1,M,∗2) where M=N/2

需要说明，如果用pytorch的GLU模型计算原论文中GLU层，需要自己构造a和b两个部分。

代码示例

理解参数dim的作用

1. 不设置dim，使用默认值-1。


>>> m = nn.GLU()
>>> input = torch.randn(4, 2)
>>> input
tensor([[ 0.4562,  0.7670],
        [ 1.7934,  0.7769],
        [-0.3021, -0.1275],
        [-1.4728,  0.7495]])
>>> output = m(input)
>>> output
tensor([[ 0.3115],
        [ 1.2285],
        [-0.1414],
        [-1.0001]])

解释：dim=-1，意味着最后一个维度，对于二维矩阵，也就是列的维度，所以是按列拆分。

2. 设置dim=0。

>>> input = torch.randn(4, 3)
>>> m = nn.GLU(dim=0)
>>> output = m(input)
>>> output
tensor([[-0.9414, -0.0830, -0.5450],
        [-0.1251, -1.1556,  0.6469]])

解释：dim=0，意味着第一个维度，对于二维矩阵，就是行的维度，所以是按行拆分。

根据上面介绍的原理，应该知道，被拆分的那个维度，向量个数必须是偶数，才能平均拆分。如果对一个4*3的矩阵按列拆分，就会报错了。

Original: https://blog.csdn.net/m0_48742971/article/details/123431686
Author: coder1479
Title: GLU（Gated Linear Unit，门控线性单元）简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625800/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

李宏毅人类语言处理2020：Speech Separation

目录 0. 背景知识补充 1. 鸡尾酒会问题 2. Speaker Separation * 2.1 两人的单通道语音分离 2.2 评估指标 – 2.2.1 信噪比(s…

人工智能 2023年5月25日
00118
微信语音技术原理_语音控制智能家居系统的实现过程和技术详解

[导读]远场语音识别、云端语义辨识、人工智能应用等等一个个技术节点得到新的突破，为智能家居提供了新的控制入口选择。本文为大家介绍一下语音控制智能家居系统的实现过程和技术详解。远场…

人工智能 2023年5月27日
0084
手把手教利用Bert实现知识库问答（详细注释）

1、数据分析数据格式如下：这个题目的意思就是判断Question和Sentence是否匹配，如果匹配label就是1 统一导入工具包 import csv import tran…

人工智能 2023年5月28日
0089
排序 (爱思创算法四)(期中测试)(答案记录)

这篇文章还是是为了帮助一些像我这样的菜鸟找到简单的题解题目描述小思老师现在拿到了一个数字序列，这个数字序列恰好由1到n这n个数字组成，但这些数字可能没有排序。由于小思…

人工智能 2023年6月27日
0048
Pytorch中的广播机制（Broadcast）

1. Pytorch中的广播机制如果一个Pytorch运算支持广播的话，那么就意味着传给这个运算的参数会被自动扩张成相同的size，在不复制数据的情况下就能进行运算，整个过程可以…

人工智能 2023年6月24日
0085
西电数据挖掘实验3——复杂网络社团检测

一、实验内容复杂网络是描述复杂系统的有力工具，其中每个实体定义成一个节点，实体间的交互关系定义为边。复杂网络社团结构定义为内紧外松的拓扑结构，即一组节点的集合，集合内的节点交互紧…

人工智能 2023年7月27日
0059
安装tensorflow-gpu版本

安装tensorflow-gpu 2.5详细步骤 1、配置python环境安装anaconda。anaconda是用于科学计算、机器学习的专用软件包，包含python环境及s…

人工智能 2023年5月25日
0086
Keras中如何设置学习率和优化器以及两者之间的关系

在集成式机器学习类库Keras中，对优化器和学习率做了很好的封装，以至于很多人搞不清楚怎么设置学习率，怎么使用优化器，两者到底有什么区别。不同的学习率对模型训练过程中的损失值lo…

人工智能 2023年6月15日
0086
速腾聚创 RoboSense RS-Helios 32线激光雷达使用 LeGO-LOAM 算法建图

配置参数解析与修改在线建图与离线建图修改 /LeGO-LOAM/LeGO-LOAM/launch/run.launch <launch> <param name…

人工智能 2023年6月10日
0074
新的优化器 Adan

论文题目：Adan: Adaptive Nesterov Momentum Algorithm forFaster Optimizing Deep Models作者单位：Sea A…

人工智能 2023年7月28日
0069
深度学习与自然语言处理第一次作业——中文平均信息熵的计算

一、作业内容 1. 阅读文章【腾讯文档】Entropy_of_English_PeterBrownhttps://docs.qq.com/pdf/DUUR2Z1FrYUVqU0t…

人工智能 2023年5月31日
0079
Python+大数据-数据分析与处理(六)-综合案例

Python+大数据-数据分析与处理(六)-综合案例案例一：Appstore数据分析学习目标掌握描述性数据分析流程能够使用pandas、seaborn进行数据分析和可视化 …

人工智能 2023年7月7日
0067
【DenseFusion系列目录】代码全讲解+可视化+计算评估指标

DenseFusion是2019年李飞飞等提出的用于6D姿态估计的网络。它是一种端到端的结构，输入为RGB-D数据，输出为某个物体的6D姿态。主要贡献就是针对颜色特征和几何特征提出…

人工智能 2023年7月21日
0065
MATLAB图像拼接——怎么用MATLAB做拼图？

如下图所示，共有120个子图，如何用MATLAB拼接起来？ ; 1 读取数据首先读取所有图像数据，存在X中，并用imshow显示。 clear all %% 读取图片数据并显示 …

人工智能 2023年6月20日
00102
3DResNet 学习记录

近期同时在进行的两个深度学习项目都需要用到3DResNet模型，本着不做调包侠的心态，还是要好好把模型的原理看一看的。 1、ResNet结构理解首先先理解一下二维的ResNet吧…

人工智能 2023年7月28日
0071
NeRF OpenCV OpenGL COLMAP DeepVoxels坐标系朝向

OpenCV坐标系朝向 x points right, y points down, z points towards scene即[right, down, forwards] …

人工智能 2023年6月19日
0098

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

GLU（Gated Linear Unit，门控线性单元）简介

理解参数dim的作用

大家都在看