BERT学习

2023年5月31日上午2:59 • 人工智能 • 阅读 88

bert通过对语料进行无监督学习，该模型自动学习各种信息。

一：模型简介

1、结构：

bert是个有12层encoder组成的结构，只有encoder，没有decoder。

encoder的结构，来自transformer：

2、无监督语料MLM-AR/AE

AR：自回归模型（通过概率推导）；AE：自编码模型（通过掩码）。

AR：P（我爱吃饭） = P（我）P（爱|我）P（吃|我爱）P（饭|我爱吃）

AE：P（我爱吃饭|我爱mask饭） = P（mask=吃|我爱饭）

bert采用AE。即，通过从mask周围的文本进行学习，使得mask文本无线接近原词汇。但mask模型，是假定其每个mask的词是独立同分布。

bert：0.15的概率采用mask。但在mask的内容里：10%不动+10%替换其他+80%替换mask

#function：create_masked_lm_predictions
#file：create_pretraining_data.py

masked_token = NONE

if rng.random() < 0.8:
    masked_token = "[mask]"
else :
    if rng.random() < 0.5:
        masked_token = token[index]#不变
    else :
        masked_token = vocab_words[rng.randint( 0 , len (vocab_words) - 1)#随机替换

二：适用分析

1、微博情感分析步骤

通用预料训练LM（pretrain）-google bert

相同领域训练LM（Domain transfer）-大量微博数据训练bert

建议：动态mask。epoch对mask的训练采用动态；做n-gram mask

任务相关的小数据训练LM（Task transfer）-在微博情感文本+部分非情感文本分析bert

相关数据做微调，fine-tune

2、

cite：

Transformer各层网络结构详解！面试必备！(附代码实现) – mantch – 博客园

Original: https://blog.csdn.net/guanjian6334/article/details/122096516
Author: 0x3fffffff
Title: BERT学习

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/548117/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别

Tensorflow 和 Pytorch 中 Conv2d Padding的区别 Pytorch中Conv2d的Padding 它可以有三种形式：整数、二进制和字符串。 [En] …

人工智能 2023年5月24日
0083
sess.run()详解

TensorFlow与我们正常的编程思维略有不同：先预定义一些操作/占位符构建graph，所有的操作op和变量都视为节点,TensorFlow中的语句不会立即执行；当构建完gr…

人工智能 2023年6月16日
0066
Python使用opencv实现图片定位第三种方式

-*- encoding=utf-8 -*- __author__ = ‘Jeff.xie’ #这个方法识别度更高，比cv2.matchTemplate更好， #cv2.match…

人工智能 2023年6月19日
0072
JavaScript 70 JavaScript Ajax 70.9 XML 应用程序

JavaScript 文章目录 * – + JavaScript + 70 JavaScript Ajax + * 70.9 XML 应用程序 * – 70…

人工智能 2023年6月26日
0085
Failed to load image Python extension: libtorch_cuda_cu.so

1. 问题描述运行一个Pytorch的深度学习工程，当安装好各项以来之后，运行程序，出现如下错误： /root/anaconda3/envs/yolox/lib/python3….

人工智能 2023年7月21日
0088
机器学习——RBF神经网络

RBF神经网络本文部分资料与案例来源：《MATLAB神经网络43个案例分析》 RBF神经网络简述再介绍RBF神经网络之前我们先来看一下径向基函数（RBF），在百度百科上，RBF…

人工智能 2023年6月24日
00121
YOLOv5系列 1、制作自己的数据集

YOLOv5系列 1、制作自己的数据集YOLOv5系列 2、使用yolov5识别自己的数据文章目录前言一、下载Labelme 二、Labelme使用步骤 * 1.打开Labe…

人工智能 2023年6月15日
0086
机器人抓取（多目标检测）学习笔记一

论文： Real-world Multi-object, Multi-grasp Deep Grasp: Detection and Localization of Grasps …

人工智能 2023年7月12日
0076
计算机视觉教程0-3：为何拍照会有死亡视角？详解相机矩阵与畸变

目录 0 拍照的死亡角度 1 透视相机模型 2 相机矩阵 3 镜头畸变 0 拍照的死亡角度拍照死亡角度一般指的是将自己脸盆子拍得特别大，拍出用鼻孔看人的狰狞面目，比如下面这张照片…

人工智能 2023年6月18日
0083
Smartbi助你解决银行高价值客户流失难题

目前银行产品存在同质化现象，客户选择产品和服务的途径越来越多，客户对产品的忠诚度越来越低，所以客户流失已经成为银行业最关注的问题之一。而获得新客的成本远高于维护老客户成本。据调研…

人工智能 2023年6月11日
0087
卷积神经网络有哪些应用,卷积神经网络有何用途

什么是卷积神经网络？为什么它们很重要卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单…

人工智能 2023年6月16日
00100
机器学习实战——分类

3.1 MNIST数据集本章使用MNIST数据集（一组美国高中生和人口调查局员工有些的70000个数字的图片）。获取该数据集的代码如下： from sklearn.dataset…

人工智能 2023年7月1日
0076
机器学习中的数学——距离定义（二十二）：海林格距离（Hellinger Distance）

我们假设p p p和q q q是两个概率测度，并且它们对于第三个概率测度λ \lambda λ来说是绝对连续的，则p p p和q q q的海林格距离（Hellinger Dista…

人工智能 2023年6月25日
0064
海思 YOLOv5 pytorch 转 onnx 转 Caffe 再转 wk 的转化详解

目录：前沿 YOLOv5模型的选取与修改 YOLOv5 pytorch 转 onnx 转 Caffe YOLOv5 Caffe转wk文件总结参考前沿作者在将YOLOv5…

人工智能 2023年6月17日
0088
超分辨率——基于SRGAN的图像超分辨率重建(Pytorch实现)

基于SRGAN的图像超分辨率重建本文偏新手项，因此只是作为定性学习使用，因此不涉及最后的定量评估环节目录基于SRGAN的图像超分辨率重建 * 1 简要介绍 2 代码实现 &#…

人工智能 2023年6月16日
0080
matlab基础知识总结，持续更新中……

matlab基础知识总结，持续更新中…… 仅供参考! 函数用法请以matlab帮助（help）为主!! 如有错误，敬请指出! matlab基础知识总结，持续…

人工智能 2023年6月1日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

BERT学习

大家都在看