在RNN模型中引入注意力机制（Attention）

2023年5月27日下午11:43 • 人工智能 • 阅读 137

此前的文章介绍过Seq2seq模型，并将其用于机器翻译。Seq2seq模型的一个问题在于随着输入句子越来越长，更早输入的单词就很大可能会被忘掉。于是，随着输入句子中单词数变多，翻译质量就会很快劣化。改善此问题的一个方法就是引入注意力机制（Attention），这种方法最初在文献【1】中被提出。

下面是【1】中给出的一个评估机器翻译质量的图示，其中横轴是句子中单词的数量，纵轴是评价机器翻译质量的BLEU分值。可见，随着句子中单词的数量的增多，Seq2seq模型的机器翻译质量劣化得很快，但在引入了Attention之后，翻译质量可以得到很大改善。

总的来说，注意力机制有如下一些优点：

• Attention tremendously improves Seq2Seq model.

• With attention, Seq2Seq model does not forget source input.

• With attention, the decoder knows where to focus.

但我们也需明白，引入Attention会大幅增加模型的计算量！

具体来说，如何在RNN中引入Attention呢？结合之前介绍的Seq2seq模型，如下图所示，Encoder的输出是

，对于每个Cell的

Original: https://blog.csdn.net/baimafujinji/article/details/123810692
Author: 白马负金羁
Title: 在RNN模型中引入注意力机制（Attention）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/528188/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Nvidia Tesla A100 驱动安装方法

Nvidia Tesla A100 驱动安装方法遇到的问题：以前安装tesla系列、geforce系列等gpu 驱动的时候，只需执行nvidiaxxxx.run驱动包或者安装nv…

人工智能 2023年5月23日
0088
R语言pheatmap包热图legend位置调整

前言上一期用 pheatmap 包画完热图之后发现，虽然图很美观，但是图例位置有些不符合我的要求，我希望图例 (legend) 在左边，所以去看了看 pheatmap 函数具体参…

人工智能 2023年7月6日
0079
图像增强 — 直方图均衡化及其python实现

直方图均衡化及其python实现数字图像处理文章目录直方图均衡化及其python实现 * 展示效果理论简介 – 什么是直方图均衡化流程图：代码：这里贴一…

人工智能 2023年6月18日
0089
【工业相机】【深度4】线扫描相机 – 选型实践

前言：在工业相机的深度应用的前三节里面，针对工业相机的选型、参数、应用计算等做了一些说明。其中，在【深度3】里面，在说明工业相机在速度场景下的应用的时候，专门开了一节介绍线扫描…

人工智能 2023年7月27日
0043
虚拟数字人很忙

最近，虚拟数字人有点忙，在直播，品牌营销，企业服务上都看到虚拟数字人身影。虚拟数字人跟元宇宙有什么关系，我们一起来说说。一、虚拟数字人概念 1、定义 “虚拟数字人&#…

人工智能 2023年6月4日
0068
基于FPGA的一维卷积神经网络CNN的实现（一）框架

理论建立与效果展示环境：Vivado2019.2。Part：xcku040-ffva1156-2-i，内嵌DSP个数 1920个，BRAM 600个也就是21.1Mb。说明：通…

人工智能 2023年6月17日
0069
最新MySql安装教学，非常详细

目录一、下载MySQL 1. 选择想要安装的版本，点击Download下载二、安装MySq 1. 选择设置类型 2. 选择安装的产品和功能 3.选完以后，点击右下方的&#822…

人工智能 2023年7月30日
0042
数据分析工具pandas

一、pandas的数据结构分析 Pandas 中有两个主要的数据结构：Series 和DataFrame 。 Series 是一维的数据结构，DataFrame是二维的、表格型的数…

人工智能 2023年7月17日
0049
python逻辑回归（logistic regression LR) 底层代码实现 BGD梯度下降算法 softmax多分类

逻辑回归前面用sigmoid函数实现了基本逻辑回归的二分类，感兴趣的童鞋点击###python逻辑回归（logistic regression LR) 底层代码实现 BGD梯度下…

人工智能 2023年7月2日
0085
在VS2017上安装opencv及配置

1. 文件下载。 opencv下载官网https://opencv.org/releases,也可以在他们的github上下载https://github.com/opencv/o…

人工智能 2023年7月19日
0047
opencv [c++] 连通域分析connectedComponentsWithStats() 和 connectedComponents()

1. API相关参数介绍： labels ：对原始图中的每一个像素都打上标签，背景为0，连通域打上1，2，3。。。的标签，同一个连通域的像素打上同样的标签。相当与对每一个像素进行了…

人工智能 2023年5月26日
00234
✨使用Python进行线性规划求解，高端操作亮瞎你的双眼（文末技术彩蛋）

各位童鞋们大家好，我是小小明，前几天我给大家分享了一个SMT求解器z3，链接地址见： https://xxmdmst.blog.csdn.net/article/details/1…

人工智能 2023年7月4日
00101
开源ESP-MASTER 语音人脸识别空调控制LVGL

KS_ESP32_MASTER 这次开源的项目 ESP MASTER是一个综合性极强的项目，他的功能有:1、语音识别。将数字麦克风通过I2S连接到ESP32，经过esp-skain…

人工智能 2023年5月25日
0075
pytorch中nn.Parameter()使用方法

对于 nn.Parameter()是pytorch中定义 可学习参数的…

人工智能 2023年6月29日
0069
深度学习模型计算量评价指标FLOPs, MACs, MAdds关系

在评价深度学习模型的大小和计算量时，经常使用的参数有：parameters, FLOPs, MACs, MAdds。除此以外，我们还经常见到MAC, FLOPS, GFLOPS, …

人工智能 2023年7月20日
0050
Detected that PyTorch and torchvision were compiled with different CUDA version报错处理

报错原因：pytorch版本和torchvision版本不一致。报错处理步骤：一、需要先查看你的pytorch版本，我采用的是新建一个文件输出pytorch版本。 import…

人工智能 2023年7月22日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

在RNN模型中引入注意力机制（Attention）

大家都在看