从训练和预测的角度来理解Transformer中Masked Self-Attention的原理

2023年5月30日下午8:21 • 人工智能 • 阅读 102

传送门：手把手教你用Pytorch代码实现Transformer模型（超详细的代码解读）

Transformer模型结构图

在Transformer中Decoder会先经过一个masked self-attention层

从训练和预测的角度来理解Transformer中Masked Self-Attention的原理

使用Masked Self-Attention层可以解决下文提到的训练阶段和预测阶段Decoder可能遇到的所有问题。

; 什么是Masked Self-attention层

你只需要记住：masked self-attention层就是下面的网络连线（如果实现这样的神经元连接，你只要记住一个sequence mask，让右侧的注意力系数α i j = 0 \alpha_{ij}=0

Original: https://blog.csdn.net/qq_43827595/article/details/120400168
Author: 白马金羁侠少年
Title: 从训练和预测的角度来理解Transformer中Masked Self-Attention的原理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544892/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用TDOA进行声源定位

目录 1. TDOA简介 2. 时延估计 3. 定位估计 4. 声源定位根据现有的研究成果来看，声源定位(Sound Source Localization, SSL)存在以下几…

人工智能 2023年5月25日
0077
【sklearn】详解classification_report的分类报告计算

简介说来惭愧，好久不写博客，让我动笔的竟然是sklearn一个小小的api功能，以前评价模型用的都是总体的准确率，第一次用sklearn提供的分类报告功能竟然搞不懂是怎么计算的，…

人工智能 2023年6月30日
00134
pytorch_grad_cam——pytorch下的模型特征(Class Activation Mapping, CAM)可视化库

深度学习是一个”黑盒”系统。它通过”end-to-end”的方式来工作，中间过程是不可知的，通过中间特征可视化可以对模型的数据进行一…

人工智能 2023年7月21日
0067
（六十七）神经网络——MLP

神经网络的原理本文重点介绍的是”多层感知器”（Multilayer Perceptron），即MLP算法，也被称为前馈神经网络，或者被称为人工神经网络（A…

人工智能 2023年7月13日
0085
如何在PyTorch中创建和训练一个神经网络模型

1. 介绍在PyTorch中创建和训练一个神经网络模型是一个非常常见的任务。神经网络是机器学习中的一个重要组件，可以用来解决各种问题，如图像分类、目标检测、语言处理等。本文将详细…

人工智能 2024年1月2日
0037
【python 数据分析】不同情况下的t检验、Wilcoxon符号秩检验、Wilcoxon秩和检验、卡方检验、Fisher检验

（1）单样本举例：H 0 : μ = 3.1 ⇌ H 1 : μ ≠ 3.1 H_0:\mu= 3.1 \rightleftharpoons H_1:\mu \neq 3.1 H…

人工智能 2023年6月11日
0098
mask rcnn 将mask 转json数据01

目的：存在图片及其对应的mask 文件，通过Python代码转化为json 数据，无需手工制作 1、首先准备好图片和及其对应的mask ，使用的mask为黑底白色 #!/us…

人工智能 2023年5月26日
0087
01背包和完全背包

01背包最大约数和题目链接点击这里题目描述选取和不超过 S S S 的若干个不同的正整数，使得所有数的约数（不含它本身）之和最大。输入格式输入一个正整数 S S S。 …

人工智能 2023年7月29日
0079
C++QT开发——QWidget

QWidget QWidget类是所有窗口类的父类(控件类是也属于窗口类), 并且QWidget类的父类的QObject, 也就意味着所有的窗口类对象只要指定了父对象, 都可以实现…

人工智能 2023年6月27日
0090
华为云ModelArts完整流程引导——贴心的细致-帮你1小时完成整个训练过程

导读：华为云ModelArts是面向开发者的一站式AI开发平台，为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成，及端-边-云模…

人工智能 2023年7月26日
0061
【我是土堆 – PyTorch教程】学习随手记

目录 1. Pytorch环境的配置及安装如何管理项目环境？如何看自己电脑cuda版本？安装Pytorch 2. Python编辑器的选择、安装及配置 PyCharm PyC…

人工智能 2023年7月5日
0051
嵌入式端音频开发（Unisound篇）之 7.1 蜂鸟M离线语音芯片简介

云知声总部位于北京，在上海、深圳、厦门设有全资子公司。是一家专注物联网人工智能服务、拥有完全自主知识产权的世界顶尖的智能语音识别和语义理解技术的高新技术企业。自2012年由智能语音…

人工智能 2023年5月25日
0077
基于Pytorch的MNIST手写数字识别实现（含代码+讲解）

说明：本人也是一个萌新，也在学习中，有代码里也有不完善的地方。如果有错误/讲解不清的地方请多多指出本文代码链接: GitHub – Michael-OvO/mnist…

人工智能 2023年7月21日
0069
语音分离Sepformer

链接：https://arxiv.org/pdf/2010.13154.pdf github:https://speechbrain.github.io/ 摘要 RNN…

人工智能 2023年5月27日
00110
【Python爬虫】数据解析之bs4解析和xpath解析

🔥一个人走得远了，就会忘记自己为了什么而出发，希望你可以不忘初心，不要随波逐流，一直走下去🎶🦋 欢迎关注🖱点赞👍收藏🌟留言🐾🦄 本文由程序喵正在路上原创，CSDN首发！💖 系列…

人工智能 2023年7月4日
0074
猿创征文｜【云原生】学习云原生经验分享

博主昵称：跳楼梯企鹅博主主页面链接：博主主页传送门博主专栏页面连接：专栏传送门–网路安全技术创作初心：本博客的初心为与技术朋友们相互交流，每个人的技术都存在短板，博…

人工智能 2023年6月23日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

从训练和预测的角度来理解Transformer中Masked Self-Attention的原理

大家都在看