NLP-预训练模型-2019-NLU+NLG：UniLM（自然语言理解与生成的统一预训练语言模型）

2023年5月30日下午9:32 • 人工智能 • 阅读 71

UniLM论文全名为Unified Language Model Pre-training for Natural Language Understanding and Generation，译为自然语言理解与生成的统一预训练语言模型。

本文提出了采用BERT的模型，使用三种特殊的Mask的预训练目标，从而使得模型可以用于NLG，同时在NLU任务获得和BERT一样的效果。模型使用了三种语言模型的任务：

unidirectional prediction
bidirectional prediction
seuqnece-to-sequence prediction

; 一、概述

目前，预训练的语言模型（Language model ）已经大幅地提高了各种自然语言处理任务的水平。它一般使用大量文本数据，通过上下文来预测单词，从而学习到文本上下文的文本表示，并且可以进行微调以适应后续任务。不同类型的预训练语言模型一般采用不同的预测任务和训练目标，如表1所示。ELMo模型学习两个单向语言模型（unidirectional LM）：前向语言模型从左到右读取文本进行编码，后向语言模型从右到左读取文本进行编码。GPT模型使用Transformer编码解码器从左到右的一逐字地预测文本序列。BERT模型使用一个双向Transformer编码器通过被掩字上下文来预测该掩蔽字。

尽管BERT模型已经显著地提高了大量自然语言理解任务的效果，但是由于它的双向性使得它很难应用于自然语言生成任务。

Original: https://blog.csdn.net/u013250861/article/details/123648710
Author: u013250861
Title: NLP-预训练模型-2019-NLU+NLG：UniLM（自然语言理解与生成的统一预训练语言模型）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/545219/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Tensorflow训练数字识别数据集并部署在OpenCV上

leNet训练自制数据集并部署在OpenCV上 –0. 简介 –1. 数据集介绍 –2. 数据集读取 –3. 网络搭建 &#8211…

人工智能 2023年5月24日
0062
CPU组成和运行

CPU是什么 CPU的全称是 Central Processing Unit（中央处理器），CPU与计算机的关系就相当于大脑和人的关系。它是一种小型的计算机芯片，它嵌入在台式机、笔…

人工智能 2023年6月29日
0076
ArcGIS应用基础3 属性表的操作-以人口密度分布图为例

🎯🎯🎯其他GIS空间分析文章目录一、实验名称二、实验目的三、实验准备 1.数据准备 2.软件准备四、实验步骤 1.数据加载 2.属性表添加字段 3.属性表连接 4.字段计…

人工智能 2023年7月15日
00102
基于Keras实战项目-猫狗熊猫分类大战

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉深度学…

人工智能 2023年7月3日
00121
基于Pytorch的卷积神经网络CNN实例应用及详解

基于Pytorch的卷积神经网络CNN实例应用及详解一、卷积神经网络CNN定义卷积神经网络（CNN，有时被称为 ConvNet）是很吸引人的。在短时间内，它们变成了一种颠覆性的…

人工智能 2023年7月22日
0066
阿里天池：小样本商标检测（baseline0.50）

阿里天池：小样本商标检测（baseline0.50）在学会YOLO目标检测后第一次参加这样的比赛，特此做个记录，此处也提出一些改进的方案。比赛链接：ICME-2022 安全AI挑…

人工智能 2023年7月10日
0089
LeetCode刷题记录02——新手村专辑(一)

新手村专辑题目 * 1480一维数组的动态和 – 我的思路我的代码提交结果 + 代码优化总结 383赎金信 – 我的思路我的代码提交结果 + 代…

人工智能 2023年6月29日
0094
数据分析-数据预处理

数据分析-数据预处理处理重复值 duplicated( )查找重复值 import pandas as pd a=pd.DataFrame(data=[[‘A’,19],[‘B’…

人工智能 2023年7月7日
0063
机器学习基础：用 Lasso 做特征选择

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月16日
0059
【Pytorch源码模板】深度学习代码：各种骨干网（分类、分割、轻量化、姿态、识别）、注意力、Loss、可视化、数据增强（十万行代码整理，超强模板，入门即精通不是梦）

目录 1. 前言 2. 源码框架 3. 数据增强和网络正则化方法 4. 模型 4.1 各种骨干网络 4.2. 大量注意力机制 4.3. 轻量型网络 4.4 生成对抗网络GAN 4….

人工智能 2023年7月1日
0081
opencv训练自己的模型，实现特定物体的识别

1.说明 opencv安装包中有训练好的分类器文件，可以实现人脸的识别。当然，我们也可以训练自己的分类器文件，实现对特定物体的识别。本文章就详细介绍下如何训练自己的分类器文件。 2…

人工智能 2023年7月26日
00104
自动驾驶系统进阶与项目实战（十）基于PointPillars的点云三维目标检测和TensorRT实战（1）

; 自动驾驶系统进阶与项目实战（十）基于PointPillars的点云三维目标检测和TensorRT实战（1）发表于CVPR2019的PointPillars是目前比较受业内认可…

人工智能 2023年7月10日
0071
【手撕算法】【NLP】【Embedding】word2vec原理，代码实现

文章目录 1.前言 2.简介 3.原理 * 3.1.什么是Word Embedding（词嵌入）？ 3.2.什么是word2vec？ 3.3.逐步解释word2vec 之 CBOW…

人工智能 2023年5月28日
00107
线性回归实现

深度学习第一章：最简单的线性回归实现 1. 引言 AI领域的线性回归和其他领域不太一样，包括了名词和实现方式，所以必须先认识重要名词，再把所有步骤熟悉一边，并建立在之前学习线性回归…

人工智能 2023年6月4日
00105
使用pandas读取xlsx

一、使用pandas读取xlsx 引用pandas库 import pandas as pd pd.read_excel(path, sheet_name=0, header=0,…

人工智能 2023年7月7日
0070
矩池云上安装yolov4 darknet教程

这里我是用PyTorch 1.8.1来安装的拉取仓库官方仓库 git clone https://github.com/AlexeyAB/darknet 镜像仓库 git cl…

人工智能 2023年6月4日
0097

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NLP-预训练模型-2019-NLU+NLG：UniLM（自然语言理解与生成的统一预训练语言模型）

大家都在看