关于attention机制的理解

2023年5月28日下午2:42 • 大数据 • 阅读 56

1.encoder-decoder机制
中间会产生一个语义编码向量c，而这个c是固定长度的，且不变的。引入attention就是为了根据输出y来调整c。
2.attention的计算
encoder中存在隐藏状态h，c就是关于h的加权和
3.self attention
探索序列内部的关系

attention中的softmax

attention score 被称为相似度（匹配度、影响得分）
输入中的隐藏状态h1，h2，…对输出的影响不同，各自占有的权重应该是不一样的。
将得分映射到概率上就可以表示权重了。

进一步理解

1.首先隐藏状态的可以通过一些模型得到，比如由RNN encoder 输入（x1,x2,…）得到，同样输出y也是如此，它的隐藏状态可以设为s（有的资料为H),encoder的最后一个隐藏状态就是decoder的第一个隐藏状态。
st=f(st-1,yt-1,ct)
ct指的是context vector
权重是由st-1和h之间的相关性softmax得到的
求p(yi|y1,y2,…yi-1,si,ci)进行预测

Original: https://blog.csdn.net/iridescentc/article/details/123000093
Author: iridescentc
Title: 关于attention机制的理解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532113/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

通过Thread Pool Executor类解析线程池执行任务的核心流程

今天，我们通过Thread Pool Executor类的源码深度解析线程池执行任务的核心流程，小伙伴们最好是打开IDEA，按照步骤，调试下Thread Pool Executor…

大数据 2023年6月2日
0064
大数据hive篇–hive去重

大数据 2023年11月14日
0030
群晖下 gitea+drone+harbor实现CI/CD 发布到云服务器

常用命令 sudo -i然后输入密码&#…

大数据 2023年5月27日
0092
Hive修改Parquet类型表字段几种问题处理

hive中的表数据存储类型可以使用parquet，优势在于列式存储方便压缩，加快查询速度，在实际生产环境中，往往不会有字段命名或类型修改的数仓宽表才会使用。临时或短期需求使用pa…

大数据 2023年11月13日
0036
KBQA中用到强化学习的相关论文

最近对用到强化学习的论文进行了简单整理，方便之后查看。我主要是分为两类统计：基于语义解析的方法和基于信息检索的方法。具体的如下：基于语义解析的KBQA方法 1. 原论文：Grap…

大数据 2023年5月28日
0061
Shell 脚本编程-函数的定义与调用

java 语言： public int methodName(int x,String name){ } javascript: function mN(x,name){ &#82…

大数据 2023年5月25日
0068
[数据仓库]维度建模基础理论

[数据仓库]维度建模基础理论原创 qq59caeb714a7a42022-07-09 00:26:34博主文章分类：数据仓库 ©著作权文章标签数据仓库文章分类数据仓库大…

大数据 2023年5月25日
00100
利用pyhton爬虫(案例3)–X房网的小房子们

写了个小案例，顺便复习一下以前学的知识点。PS:复试之前绝不写爬虫案例了(对于现在的我来说，费脑又花时间)，再写我吃XX. 文章目录爬取X房网二手房信息爬取步骤…

大数据 2023年5月26日
0064
K8S+Docker容器化云高可用集群实战

作者：CARLOS_CHIANG出处：http://www.cnblogs.com/yaoyaojcy/本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文…

大数据 2023年5月29日
0073
【SpringBoot实战】视图技术-Thymeleaf

前言在一个Web应用中，通常会采用MVC设计模式实现对应的模型、视图和控制器，其中，视图是用户看到并与之交互的界面。对最初的Web应用来说，视图是由HTML元素组成的静态界面；而…

大数据 2023年6月3日
0073
Redis数据结构之——hash

大数据 2023年11月16日
0036
「跑象科技」获得天使+融资，打造新一代实时数据基础平台

大数据 2023年11月14日
0031
小米运动睡眠数据导出并分析（python）

背景：我本身是做数据分析的，因为长期失眠所以想看看自己小米手环上面的数据，找找原因。因为小米运动上自带的报表比较粗浅，所以就想自己导出数据，深入分析一波。 1 备份小米运动并导出 …

大数据 2023年11月11日
00165
Docker 进阶篇

Docker Compose 简介官方介绍安装官方教程PS: curl -L https://get.daocloud.io/docker/compose/releases/…

大数据 2023年5月29日
0068
Redis下载部署并加入idea应用（详细笔记）

大数据 2023年11月15日
0042
Zeppelin(0.10.1版本)安装及创建hive解释器

目录 1. Zeppelin安装 2. Zeppelin网页配置连接hive 利用Zeppelin工具操作hive,需确保电脑已经启动Hadoop集群和hiveserver2服务。…

大数据 2023年11月12日
0058

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球