BERT可视化工具bertviz体验

2023年5月28日下午1:28 • 大数据 • 阅读 97

bertviz简介

BertViz 是一种交互式工具，用于在Transformer语言模型（如 BERT、GPT2 或 T5）中可视化注意力网络。它可以通过支持大多数Huggingface 模型，可以简单地通过 Python API 在 Jupyter 或 Colab 笔记本中运行。BertViz 扩展了 Llion Jones的Tensor2Tensor 可视化工具，添加了多个视图，每个视图都为注意力机制提供了独特的视角。

具体计算原理：https://towardsdatascience.com/deconstructing-bert-part-2-visualizing-the-inner-workings-of-attention-60a16d86b5c1

安装命令

pip安装

pip install bertviz

其他依赖安装

pip install jupyterlab
pip install ipywidgets

可视化例子

构建数据与模型

from bertviz import head_view, model_view
from transformers import BertTokenizer, BertModel
model_version = 'bert-base-uncased'
model = BertModel.from_pretrained(model_version, output_attentions=True)
tokenizer = BertTokenizer.from_pretrained(model_version)
sentence_a = "The cat sat on the mat"
sentence_b = "The cat lay on the rug"
inputs = tokenizer.encode_plus(sentence_a, sentence_b, return_tensors='pt')
input_ids = inputs['input_ids']
token_type_ids = inputs['token_type_ids']
attention = model(input_ids, token_type_ids=token_type_ids)[-1]
sentence_b_start = token_type_ids[0].tolist().index(1)
input_id_list = input_ids[0].tolist()
tokens = tokenizer.convert_ids_to_tokens(input_id_list)

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertModel: ['cls.seq_relationship.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.predictions.transform.dense.weight', 'cls.seq_relationship.bias', 'cls.predictions.bias', 'cls.predictions.transform.LayerNorm.weight']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).

- This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).

注意力头可视化

注意力头视图可视化来自单个 Transformer 层的一个或多个头部的注意力。每行显示从一个标记（左）到另一个标记（右）的注意力。线重反映注意力值（范围从 0 到 1），而线条颜色标识注意力头。选择多个头时（由顶部的彩色片状表示），相应的可视化彼此叠加。具体解释可以查看博客

head_view(attention, tokens, sentence_b_start)

👉 将鼠标悬停在可视化左侧/右侧的任何标记上，以过滤来自/到该标记的注意力。

👉 双击顶部的任何彩色图块以过滤到相应的注意力头。

👉 单击任何彩色图块以切换选择相应的注意力头。

👉 单击图层下拉菜单以更改模型图层（零索引）。

模型视图

模型视图提供了整个模型中注意力的预览图。每个单元格显示特定头部的注意力权重，按层（行）和头部（列）索引。每个单元格中的线表示从一个标记（左）到另一个标记（右）的注意力，线重与注意力值成正比（范围从 0 到 1）。具体解释可以查看博客
用法：

👉单击任何单元格以查看相关注意力头的注意力详细视图（或取消选择该单元格）。

👉 然后将鼠标悬停在详细视图左侧的任何标记上以过滤来自该标记的注意力。

model_view(attention, tokens, sentence_b_start)

神经元视图

神经元视图可视化用于计算注意力的中间表示（例如查询和关键向量）。在折叠视图（初始状态）中，线条显示了从每个标记（左）到每个其他标记（右）的注意力。在展开的视图中，该工具跟踪产生这些注意力权重的计算链。关于注意力机制的详细解释，请参考博客。

用法：

👉 将鼠标悬停在可视化左侧的任何标记上，以过滤来自该标记的注意力。

👉然后单击悬停时显示的加号图标。这暴露了用于计算注意力权重的查询向量、关键向量和其他中间表示。每个色带代表一个神经元值，其中颜色强度表示幅度，色调表示符号（蓝色=正，橙色=负）。

👉 进入展开视图后，将鼠标悬停在左侧的任何其他标记上以查看相关的注意力计算。

👉 单击图层或头部下拉菜单以更改模型图层或头部（零索引）。

from bertviz.transformers_neuron_view import BertModel, BertTokenizer
from bertviz.neuron_view import show

model_type = 'bert'
model_version = 'bert-base-uncased'
model = BertModel.from_pretrained(model_version, output_attentions=True)
tokenizer = BertTokenizer.from_pretrained(model_version, do_lower_case=True)
show(model, model_type, tokenizer, sentence_a, sentence_b, layer=4, head=3)

Original: https://blog.csdn.net/yanqianglifei/article/details/122483179
Author: 致Great
Title: BERT可视化工具bertviz体验

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531790/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

linux命令_awk

AWK 是一种处理文本文件的语言，是一个强大的文本分析工具。之所以叫 AWK 是因为其取了三位创始人 Alfred Aho，Peter Weinberger, 和 Brian K…

大数据 2023年5月27日
0086
Kafka集群管理工具kafka-manager的安装使用

一.kafka-manager简介 kafka-manager是目前最受欢迎的kafka集群管理工具，最早由雅虎开源，用户可以在Web界面执行一些简单的集群管理操作。具体支持以下内…

大数据 2023年5月28日
0093
【TTransportException: java.net.SocketException: Broken pipe (Write failed))】

@TOC Error querying database. Cause: java.sql.SQLException: org.apache.thrift.transport.TT…

大数据 2023年11月13日
0058
Grunt的使用

在Node环境下。需要预先安装好Node。 1、安装grunt-cli 2、创建一个目录test 3、进入test目录，创建一个package.json文件，内容如下： 4、安装g…

大数据 2023年6月3日
0061
hive详解（数据类型、数据库操作、数据操作）

一 hive的数据类型 1.1 基本数据类型 1.2 集合数据类型 1.3 类型转换二 DDL（Data Definition Language）数据定义 2.1数据库操作 2….

大数据 2023年11月12日
0028
九、N-gram语言模型

1.语言模型语言模型的作用是根据文本输入，计算文本内容是句子的概率。 ; 2 N-gram模型介绍 2.1 语言模型概念如果我们有一个由m 个词组成的序列（或者说一个句子），…

大数据 2023年5月28日
0087
hxb海啸杯

web welcome to 海啸杯查看源代码，拿到flag。 HXBCTF{welcome _to_HXB} 极客邀请函考点：SQLite get shell、SUID提权 …

大数据 2023年11月10日
0041
【网络安全】基于centos7搭建discuz+redis服务

大数据 2023年11月13日
0041
Linux 网络配置

基本网络配置网络配置的几个相关设置： – 主机名 – IP/netmask – 路&amp…

大数据 2023年5月27日
0097
【自然语言处理】self-attention和Transformer的详解

本文主要对李宏毅机器学习的课程进行了简单的总结。首先是解释了self-attention自注意力机制的原理，还有multi-head attention多头注意力机制、masked…

大数据 2023年5月28日
0086
实时开发平台建设实践，深入释放实时数据价值丨 04 期直播回顾

原文链接：实时开发平台建设实践，深入释放实时数据价值视频回顾：点击这里课件获取：点击这里一、实时数仓建设背景随着整体行业的数字化转型不断深入以及技术…

大数据 2023年5月26日
0092
MacOS 安装 Adb (Android调试桥)到反编译微信小程序

什么是Adb？ Android调试桥（ adb ）是一个开发工具，帮助安卓设备和个人计算机之间的通信。这种通信大多是在USB电缆下进行，但是也支持Wi-Fi连接。 adb 还可被…

大数据 2023年11月12日
0046
【云原生】zookeeper + kafka on k8s 环境部署

一、概述二、Zookeeper on k8s 部署 1）添加源 2）修改配置 3）开始安装 4）测试验证 5）Prometheus监控 6）卸载三、Kafka on k8s 部…

大数据 2023年6月3日
0066
【大数据前置基础】大数据聚焦层面，数据仓库，OLAP和OLTP

1 大数据聚集层面 2 数据仓库 3 OLAP和OLTP 作者：Be_melting 1 大数据聚集层面让我给你举个例子：如果我是电商，我想把过去一个月卖…

大数据 2023年5月24日
0087
Redis的IO多路复用机制

大数据 2023年11月15日
0042
NLP经典论文：Word2vec、CBOW、Skip-gram 笔记

NLP经典论文：Word2vec、CBOW、Skip-gram 笔记论文介绍模型结构 * CBOW模型 – 整体模型 + 输入输出整体流程整体维度输入层与…

大数据 2023年5月28日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31