深度学习升级打怪之self attention笔记

2023年5月28日上午10:03 • 人工智能 • 阅读 76

self attention

在听了李宏毅老师关于self attention的讲解后我觉得讲的非常好😉，下面是我在听完课之后做的一些学习记录，主要的参考是李宏毅老师的网课和课件（文末给出）。

self attention在NLP和很多其它领域都有着广泛的应用，以词性标注为例。

I saw a saw

这里的第一个”saw”是动词，第二个”saw”是名词（锯子），对于词性标注而言，模型的输入和输出的数量是相同的

我们先考虑最简单的情况

假设我们将这些词单独输入到一个全连接层，再输出，那么明显我们没有考虑到词与词之间的关系，训练出来的模型效果不会很好。一个比较自然的想法是在对每一个词进行词性标注的时候都要考虑其它词的影响。那么怎样判断其它的词的重要性呢？这个问题就可以使用self attention机制来解决。

我们需要找出和当前词汇相关的向量，同时我们需要衡量向量之间的相关度，在这里我们用α \alpha α(attention score)来衡量向量之间的相关度，相关度的计算方法有很多种，比较常见的有dot production 和additive.

假设原本的向量为a i a_i a i 那么q i q_i q i 和k i k_i k i 则是由q i = W q a i q_i = W^q a_i q i =W q a i 和k i = W k a i k_i = W^k a_i k i =W k a i 这两个公式计算得来。得到了attention score之后我们往往会让其经过一个softmax层（也可以是别的激活函数）得到α ′ \alpha^{‘}α′，经过了softmax之后的attention score总和为1。有了相关度之后我们需要根据相关度计算信息，可以由下面的公式得到b i b^i b i。

图片中是以第一个向量为例，后面的向量也和第一个向量的计算方式类似。更近一步，我们可以将这样的操作写成矩阵运算的形式。

如上图所示，我们最终可以得到output。

参考资料：

https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-data/self_v7.pdf

Original: https://blog.csdn.net/weixin_44077955/article/details/122648953
Author: Serendipity-Wu
Title: 深度学习升级打怪之self attention笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530887/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

工业蒸汽量预测-模型训练

本文改编自《阿里云天池大赛赛题解析-机器学习篇》的第一部分工业蒸汽量预测的第四章-模型训练的内容。根据原有内容进行了部分素材的替换和知识点的归纳总结。sklearn模型训练步骤的总…

人工智能 2023年6月18日
0081
LabelImg（目标检测标注工具）的安装与使用教程

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥰 博客首页： knighthood2001😗 欢迎点赞👍评论🗨️❤️ 热爱python，期待与大家一同进步成长！！❤️👀给大家推荐一款很火爆的刷题、面试求…

人工智能 2023年6月26日
0082
PyTorch 入门：训练一个深度神经网络(DNN)

准备知识 1. NumPy 为什么要学 NumPy？弄懂了 NumPy 的 array，可以轻松上手 PyTorch 的 tensor。请看这个对比：torch v.s. nump…

人工智能 2023年6月16日
00109
从DETR backbone 的NestedTensor 到DataLoader, Sampler,collate_fn，再到DETR transformer

在DETR中backbone中，resnet50 的构建继承了backbonebase的类，backbonebase的前向过程如下，这里引入了NestedTensor类。 # 前向…

人工智能 2023年6月17日
00104
【成为红帽工程师】第三天 web服务器

浏览器常支持的协议有：http、https、ftp等主机地址或者主机名：主机地址就是服务器在因特网所在的IP地址。如果是主机名的话，那么就需要域名解析了。 http为80，htt…

人工智能 2023年6月26日
0065
文字隐写术-盲水印研究笔记

gitee 开源代码(java) 需求概述研究盲水印对于版权保护的效果和能力研究尝试概述水印实现: 大部分的python或者java算法都基于频域的盲水印效果。涉及的算法:…

人工智能 2023年7月19日
0071
《知识图谱——概念与技术》笔记：基础篇

文章目录 * – 1 知识图谱概述 – + 1.1 知识图谱的基本概念 + * 1.1.1 知识图谱的狭义概念 * 1.1.2 知识图谱的广义概念 + 1….

人工智能 2023年6月1日
0070
微信语音麦克风静音_iPhone7Plus手机麦克风失灵怎么办

如何检查麦克风是否损坏 [En] How to check whether the microphone is damaged or not 当麦克风出现故障时，我们可以自己检查，…

人工智能 2023年5月27日
0098
【建议背诵】软考高项考试案例简答题汇总~

为大家在考前整理了软考高项案例分析题答案汇总！考前可以速记一下。有电子版本的，可以打印下载来看看！ 1. 管理者的权力来源种类及其特点？ (1)职位权力,来源于管理者在组织中的职…

人工智能 2023年6月28日
0084
基于pytorch的图像识别基础完整教程

一、数据集爬取现在的深度学习对数据集量的需求越来越大了，也有了许多现成的数据集可供大家查找下载，但是如果你只是想要做一下深度学习的实例以此熟练一下或者找不到好的数据集，那么你也可…

人工智能 2023年6月23日
0081
搭建zynq平台下UbertoothOne运行环境

首先认是一下 UbertoothOne什么， Ubertooth是一个蓝牙实验平台。它能够嗅探蓝牙智能(BLE)，发现无法发现的经典蓝牙设备，并执行基本的经典蓝牙设备嗅探。 Ub…

人工智能 2023年6月29日
0072
颜色、形状和纹理：使用 OpenCV 进行特征提取

如何从图像中提取特征？第一次听说”特征提取”一词是在 YouTube 上的机器学习视频教程中，它清楚地解释了我们如何在大型数据集中提取特征。很简单，数据集…

人工智能 2023年6月24日
0059
【计算机视觉】OpenCV算法解析

文章目录 0. 前言 1. OpenCV 2. 线性回归算法：最小二乘法 * 【代码实现】 3. 随机采样一致性（RANSAC） * 3.1 算法简介 3.2 RANSAC在最小二…

人工智能 2023年7月19日
0051
import keras的错误module ‘tensorflow.compat.v2‘ has no attribute ‘__internal__‘

使用的tensorflow 为 import tensorflowtensorflow.versionOut[4]: ‘2.3.0’ 但import ker…

人工智能 2023年5月26日
0070
图像分类以及经典的分类模型

图像分类图像分类目的图像分类实质上就是从给定的类别集合中为图像分配对应标签的任务。例如：类别集(caegories)有(bird,dog,pig)三个类别，输入一张图片，分类模…

人工智能 2023年7月1日
00110
Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

Pytorch中卷积层转向全连接层时，全连接层输入维度的确定 * – 一、代码法： – + 改变的AlexNet网络结构： + AlexNet &#8211…

人工智能 2023年7月21日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习升级打怪之self attention笔记

大家都在看