【NLP】多语言预训练模型（mBERT和XLM）

2023年5月28日上午9:34 • 人工智能 • 阅读 83

融合多语言的预训练模型将不同语言符号统一表示在相同的语义向量空间内，从而达到跨语言处理的目的。

多语言BERT （Multilingual BERT, mBERT）

它能够将多种语言表示在相同的语义空间中。
通过HuggingFace提供的transformers库：
使用区分大小写的多语言BERT-base模型（bert-base-multilingual-cased），任务为掩码填充，即将输入的[MASK]填充为具体的标记。

from pprint import pprint
from transformers import pipeline
unmasker = pipeline('fill-mask', model='bert-base-multilingual-cased')
output = unmasker('我like[MASK]')
pprint(output)

语言自身存在混合使用，共享子词等特点：

混合使用：在一种语言的文本中，经常混有其他语言，尤其是一些同语族语言，甚至共享了一些词汇；即使是不同语族的语言，在使用时也经常会有意无意地直接使用其他语言的词汇（Code-switch）
共享子词：一些同族的语言，虽然使用的词汇有一些差异，但是词根有可能是一样的，因此经过子词切分后，就产生了大量的共享子词。这些共享的词汇或者子词作为桥梁，打通了不用语言之间的壁垒，从而将多种语言都表示在相同的语义空间内。

跨语言预训练语言模型（Cross-lingual Language Model Pretraining, XLM）

XLM采用基于双语句对的 翻译语言模型 （Translation Language Modeling, TLM) 预训练目标，将互为翻译的句子拼接起来，然后在两种语言中随机遮盖若干子词，并通过模型预测。（当一种语言对预测提供的信息不足时，另一种语言可以提供额外的补充信息，从而实现跨语言的目标。
XLM-R（XLM-RoBERTa）模型结构与RoBERTa一致，但不再依赖双语平行语料库。

Huggingface Transformers库

我们可以在模型中心[点击进入]搜索符合任务需求的模型：

Original: https://blog.csdn.net/GW_Krystal/article/details/125554805
Author: 沐兮Krystal
Title: 【NLP】多语言预训练模型（mBERT和XLM）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530799/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Win10 tensorflow_gpu、CUDA11.2、cuDNN安装和使用

CUDA各种版本大同小异，找到对应的版本下载即可 1、tensorflow_GPU的安装 tensorflow_GPU安装有很多方法，（1）直接使用pip install ten…

人工智能 2023年5月25日
0081
GNN in KG(一) Modeling Relational Data with Graph Convolutional Networks，ESWC2018

本文作者来自University of Amsterdam，Kipf作为共同一作。其实ESCW只是CCF C类会议，不过外国人当然不看CCF啦。这是本系列的第一篇，做了一阵子GNN…

人工智能 2023年6月10日
0083
阿里云图数据库GDB V3引擎发布，加速开启“图智”未来

一、业务价值，为什么我们要用图数据库？随着互联网时代的快速发展，企业的数据呈现爆发式的增长，数据之间的关联也越来越复杂，图数据库应运而生。最重要的是如何运用技术方式帮助业务发挥辅…

人工智能 2023年6月1日
0073
爬取豆瓣TOP250的电影信息（代码＋可视化＋数据分析）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月16日
0061
深度学习目标检测(YoloV5)项目——从0开始到项目落地部署

前言训练和开发环境是win10,显卡RTX3080;cuda10.2,cudnn7.1;OpenCV4.5;yolov5用的是5s的模型，2020年8月13日的发布v3.0这个版…

人工智能 2023年7月12日
0060
基于pytorch实现的视频分类——C3D模型论文复现

最近在学习视频分类任务，想要跑通一个更换数据集用到自己的课题上。看到了这篇文章及代码论文链接： http://vlg.cs.dartmouth.edu/c3d/c3d_vide…

人工智能 2023年7月21日
0051
KNN——水果分类

文章目录一、数据集处理 * – 1、下载数据集 2、统一数据集格式 3、加载数据集二、分离训练集、验证集三、定义KNN模型 * – 1、计算欧式距离 …

人工智能 2023年7月1日
0092
知识图谱属性融合_知识图谱融合_本体概念层的融合方法与技术

5.3.1 本体映射和本体集成本体映射：寻找本体间的映射规则本体集成：直接将多个本体合并为一个大本体基于单本体的集成：决定本体集成的方式：判断消除异构的单本体是应该从头建立…

人工智能 2023年6月10日
0077
工程项目创新实践课程-esp32单片机tcp/udp传输图片到opencv的实现

写在最前面内容来自我写的报告，文章结构也照搬了我的报告，因为报告有篇幅限制删掉了很多代码。水平很低难免有不少错误，希望看到的朋友可以帮我指出，后续会继续整理，继续更新。越是学习，…

人工智能 2023年7月18日
0073
python 查看程序的GPU显存占用

显示GPU显存占用方法引言一、nvidia-smi 二、windows下的任务管理器三、pynvml库四、显存不够用又没钱怎么办引言主要针对显卡：nvidia初衷：想要…

人工智能 2023年6月26日
0085
如何使用迁移学习来处理数据集小和标注困难的问题

问题介绍在机器学习中，对于数据集小和标注困难的问题，迁移学习是一种常用的解决方法。迁移学习旨在利用已经学习好的知识来解决新问题，并通过将旧问题的经验迁移到新问题中，来提高新任务的…

人工智能 2024年1月1日
0039
在VM虚拟机Ubuntu18.04安装ROS

一、换源点击Ubuntu软件，选择软件更新，将如图对勾选中（下载自—选择最佳服务器) 二、输入秘钥打开终端（ctrl+alt+t) sudo apt-key adv…

人工智能 2023年6月10日
0087
OpenCv人脸识别开发实战

一、OpenCV简介 OpenCV（全称：Open Source Computer Vision Library），是一个跨平台的计算机视觉库。OpenCV可用于开发实时的图像处理…

人工智能 2023年7月19日
0093
ROS：rosbag play系列指令（详解）

Rosbag play系列指令 Rosbag play bagFile01.bag bagFile02.bag … 播放多个录制文件：由于我们的bag录制文件并不是同…

人工智能 2023年6月10日
0098
【目标检测】YOLOv5跑xView数据集/小样本检测策略实验

前言在YOLOv5的6.1版本新出了 xView.yaml数据配置文件，提供了遥感数据集xView的检测方法。此篇就使用YOLOv5来试跑xView数据集，并对一些小样本检测的策…

人工智能 2023年6月25日
0096
tensorflow2.3下载安装教程

tensorflow2.3下载安装教程有两个版本可供下载。根据你的个人意愿选择其中一种。 [En] There are two versions to download. Cho…

人工智能 2023年5月25日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【NLP】多语言预训练模型（mBERT和XLM）

多语言BERT （Multilingual BERT, mBERT）

跨语言预训练语言模型（Cross-lingual Language Model Pretraining, XLM）

Huggingface Transformers库

大家都在看