在huggingface（transformers）加载Bert遇到的attention_mask问题

2023年6月4日下午1:35 • 人工智能 • 阅读 79

记录一个非常有意思的，看了源码才了解的Bert使用方法。

如何通过Bert实现类似left-to-right的语言模型呢？

一开始自己以为只能如下使用。

在huggingface（transformers）加载Bert遇到的attention_mask问题

自己以为关于attention_mask的输入只能是对每句话都产生一个二维的attention_mask.

但是自己需要实现left-to-right的模拟，使此时的字不能看到下一个字，只能依靠以前的字，这该怎么办呢？

https://github.com/920232796/bert_seq2seq/blob/master/bert_seq2seq/seq2seq_model.py

自己看到这个链接中构造了特殊的mask矩阵。

于是自己也随着这个代码构造了下三角矩阵输入，就以为可以解决掉的时候，报错。

关于这个报错，看来看去 extended_attention_mask这个参数很关键呢

恰好下载了一下transforemrs库的安装包

于是看了一下源码

可以看到attention_mask输入可以是二维也可是三维。

所以按照需要构造三维的下三角矩阵就可以输入了！

Original: https://www.cnblogs.com/nlpers/p/16389030.html
Author: nlp如此迷人
Title: 在huggingface（transformers）加载Bert遇到的attention_mask问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568112/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Pytorch】MNIST 图像分类代码 – 超详细解读

【Pytorch】MNIST 图像分类代码 – 超详细解读目录【Pytorch】MNIST 图像分类代码 – 超详细解读前言一、代码框架二、实现代…

人工智能 2023年7月20日
0077
图像超分辨率重建概述

概念：图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数，包括时间分辨率、空间分辨率及色阶分辨率等，体现了成像系统实际所能反映物体细节信息的能力。相较于低分辨率图像，高…

人工智能 2023年5月26日
0076
PaddleOCR识别模型训练及问题解决

1、下载PaddleOCR release2.3 2、整理数据集标签文本中的路径和标签值中间是一个tab 读取标签文件的时候，是把标签文件中的路径和上面数据集的路径合在一起，然后…

人工智能 2023年7月22日
00117
UNet、UNet++、UNet3+系列

一、unet 简介继承FCN的思想，继续进行改进。但是相对于FCN，有几个改变的地方，U-Net是完全对称的，且对解码器（应该自Hinton提出编码器、解码器的概念来，即将图像-…

人工智能 2023年7月13日
0063
Windows+Anaconda3安装对应Python版本的Opencv

今天在跑代码时发现之前经常使用的opencv竟然没有安装，所以就想着再安装一下，记录一下安装过程，方便以后查阅。 Windows+Anaconda3安装对应Python版本的Ope…

人工智能 2023年7月19日
0055
如何从零开始将神经网络移植到FPGA(ZYNQ7020)加速

如何从零开始将神经网络移植到FPGA(ZYNQ7020)加速推理前言本片文章用于对零基础的小白使用，仅供参考，大神绕道。AI一直都是做算法的热点，作为多少研究生都想蹭一蹭热度，…

人工智能 2023年7月12日
0069
人工智能及其应用-产生式系统实验-植物识别系统-java

实验一产生式系统实验一、实验目的:熟悉一阶谓词逻辑和产生式表示法，掌握产生式系统的运行机制，以及基于规则推理的基本方法。二、实验内容设计并编程实现一个小型产生式系统（如:分类、…

人工智能 2023年6月1日
0062
差分进化算法（Differential Evolution)概述

差分进化算法（Differential Evolution)概述 1 引言最优化方法分为传统优化方法和启发式优化方法两大类。传统优化方法大多利用目标函数的梯度 (或导数)…

人工智能 2023年6月15日
00138
牛客刷题总结——Python入门01:输入输出、字符串、类型转换

好的，这个问题我可以回答。首先，我们需要使用 Python 中的 requests 库来请求牛客_网站的招聘信息页面，并使用 BeautifulSoup 库从 HTML 中解析出…

人工智能 2023年7月18日
0051
【双目视觉】 SGBM算法应用（Python版）

文章目录 * – 流程图 – 相机标定 – 立体匹配 – 效果 – + 1.原图像 + 2.深度图 + 3.代码链接流…

人工智能 2023年7月4日
0063
【自动驾驶-感知-红绿灯】红绿灯识别知识点

红绿灯识别是自动驾驶中最为基础的功能，识别方法主要有两种，一种基于视觉图像识别，一种基于v2x。 v2x，即通过红绿灯自己实时发送信号状态，再由车辆低延迟接收信号。该方法要对红绿灯…

人工智能 2023年6月2日
00299
感知特性评价指标SSIM

1. Abstract 传统上，评估感知图像质量的客观方法试图利用人类视觉系统的各种已知属性来量化扭曲图像和参考图像之间的误差的可见性（差异）。在假设人类视觉感知高度适应于从场景中…

人工智能 2023年6月21日
0087
YOLO算法之YOLOv5

目录一、什么是YOLOv5？二、YOLO目标检测技术发展史 * 1、发展历程一览 2、各版本差异三、YOLOv5网络结构和组件一、什么是YOLOv5？参考学习：了解YO…

人工智能 2023年6月23日
0086
孤立森林-一个通过XJB乱分进行异常检测的算法

孤立森林(isolation Forest)算法，2008年由刘飞、周志华等提出，算法不借助类似距离、密度等指标去描述样本与其他样本的差异，而是直接去刻画所谓的疏离程度(isol…

人工智能 2023年7月17日
0073
pytorch训练卷积神经网络进行图片分类(官方教程详细解读)

pytorch训练卷积神经网络进行图片分类(官方教程详细解读) 文章主要内容 [官方文档]对pytorch针对CIFAR10数据集进行图片分类代码的解读，旨在对每一行代码的作用进行…

人工智能 2023年7月3日
0074
最全iOS 应用上架流程（提交到AppStore）

一、上架基本需求资料1、苹果开发者账号（公司已有可以不用申请，需要开通开发者功能，每年 99 美元） 2、开发好的APP 二、证书上架版本需要使用正式的证书 2、上传证书 Sign…

人工智能 2023年5月30日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

在huggingface（transformers）加载Bert遇到的attention_mask问题

大家都在看