NLP-预训练模型-2020：Electra【预训练任务RTD（ReplacedTokenDetection）替代MLM；借鉴GAN；生成器+判别器；判别器用于下游；比RoBert预训练速度大幅提升】

2023年5月31日上午3:47 • 人工智能 • 阅读 88

预训练模型(Pretrained model)：一般情况下预训练模型都是大型模型，具备复杂的网络结构，众多的参数量，以及在足够大的数据集下进行训练而产生的模型.

在NLP领域，预训练模型往往是语言模型，因为语言模型的训练是无监督的，可以获得大规模语料，同时语言模型又是许多典型NLP任务的基础，如机器翻译，文本生成，阅读理解等，常见的预训练模型有BERT, GPT, roBERTa, transformer-XL等.

NLP-预训练模型-2020：Electra【预训练任务RTD（ReplacedTokenDetection）替代MLM；借鉴GAN；生成器+判别器；判别器用于下游；比RoBert预训练速度大幅提升】

; 一、Electra概述

在 2019 年 11 月份，NLP 大神 Manning 联合谷歌做的 ELECTRA 一经发布，迅速火爆整个 NLP 圈，其中 ELECTRA-small 模型参数量仅为 BERT-base 模型的 1/10，性能却依然能与 BERT、RoBERTa 等模型相媲美，得益于 ELECTRA 模型的巧妙构思 LOSS,在 2020 年 3 月份 Google 对代码做了开源。

BERT 的预训练的过程中使用了 Masked Language Model (MLM)，随机选择输入句子中 15% 的单词，然后其中的 80% 的单词用 [mask] 替换，10% 保持不变，10% 随机替换。然后 BERT 会对这 15% 的单

Original: https://blog.csdn.net/u013250861/article/details/119361110
Author: u013250861
Title: NLP-预训练模型-2020：Electra【预训练任务RTD（ReplacedTokenDetection）替代MLM；借鉴GAN；生成器+判别器；判别器用于下游；比RoBert预训练速度大幅提升】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548417/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DCT水印嵌入与提取_(Python Version)

文章目录摘要介绍方法 * 1. 步骤 2. 代码 3. 实验现象水印嵌入相关Link 更新内容-加入攻击以及指标计算参考资料 ; 摘要在变换域进行嵌入水印有更好的鲁棒性…

人工智能 2023年5月28日
00100
跟着Cell学单细胞转录组分析(十二):转录因子分析

转录因子分析可以了解细胞异质性背后的基因调控网络的异质性。转录因子分析也是单细胞转录组常见的分析内容，R语言分析一般采用的是SCENIC包，具体原理可参考两篇文章。1、《SCENI…

人工智能 2023年6月19日
0079
Pandas数据分析—实现DataFrame的Merge(合并)

10.Pandas实现DataFrame的Merge(合并) 文章目录 10.Pandas实现DataFrame的Merge(合并) 前言 * Merge的语法：一、电影数据集的…

人工智能 2023年7月15日
0080
cookdata计算机视觉笔记整理

cv2.imread()函数读取图像的通道顺序为BGR，主流的图像通道顺序为RGB。 2.1 图像运算图像对应像素进行加减乘除运算。 cv2.add(img1, img2) cv…

人工智能 2023年6月22日
0070
Ubuntu安装Pytorch（详细）

最近发现了一个挺厉害的人工智能学习网站，内容通俗易懂，风趣幽默，感兴趣的可以点击此链接进行查看：床长人工智能教程废话不多说，请看正文！一、安装 NVIDIA GPU显卡驱动 1…

人工智能 2023年6月16日
0077
CART 分类决策树

1. Cart树简介 Cart模型是一种决策树模型，它即可以用于分类，也可以用于回归，其学习算法分为下面两步：（1）决策树生成：用训练数据生成决策树，生成树尽可能大（2）决策树…

人工智能 2023年6月16日
0065
基于PyTorch深度学习无人机遥感影像目标检测、地物分类及语义分割

随着无人机自动化能力的逐步升级，它被广泛的应用于多种领域，如航拍、农业、植保、灾难评估、救援、测绘、电力巡检等。但同时由于无人机飞行高度低、获取目标类型多、以及环境复杂等因素使得对…

人工智能 2023年6月30日
0070
OpenCV findContours详解及范例

一、函数原型及参数： void findContours( InputArray image, OutputArrayOfArrays contours, OutputArray …

人工智能 2023年5月26日
0062
4. 在Ubuntu20.04安装Anaconda Pytorch Pycharm

创建pytorch快捷方式终端进入pycharm的bin文件夹，命令行打开pycharm sh pycharm.sh 点击Tools–>Create Desktop Ent…

人工智能 2023年7月23日
0065
深度学习之目标检测

算法的设计往往&#…

人工智能 2023年6月17日
0092
深度学习-第一章神经网络面试题（大厂必问，历经半年整理）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月26日
0081
Bert+BiLSTM+CRF实体抽取

文章目录一、环境二、预训练词向量三、模型 * – 1、BiLSTM + – 不使用预训练字向量 – 使用预训练字向量 2、CRF 3、Bi…

人工智能 2023年7月24日
0070
Collaborativ

介绍 Collaborative Filtering（协同过滤）是一种常见的推荐系统算法，它利用用户行为信息（如评分、点击、购买等）来预测用户的兴趣，并向用户推荐感兴趣的物品。协同…

人工智能 2024年1月5日
0038
最简单体验TinyML、TensorFlow Lite——ESP32跑机器学习（全代码）

目录前言数据采集、处理 * 导入包正弦波数据生成数据集分类模型1训练 * 模型1创建模型1训练检查训练指标模型2训练模型导出（TensorFlow Lite）模…

人工智能 2023年6月15日
00261
深度学习面试题汇总大全（转）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0078
3D知识图谱可视化

目录一、参考代码 * 1. Github参考 2. Demo参考二、为什么使用3D做图谱可视化 * 1. 背景 2. 使用D3绘制的问题 2. 2D和3D渲染的对比（D3 vs…

人工智能 2023年6月1日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NLP-预训练模型-2020：Electra【预训练任务RTD（ReplacedTokenDetection）替代MLM；借鉴GAN；生成器+判别器；判别器用于下游；比RoBert预训练速度大幅提升】

大家都在看