山东大学软件工程应用与实践—-SENTA代码分析（十）

2023年5月28日上午11:48 • 大数据 • 阅读 82

2021SC@SDUSC

这篇代码主要来分析一下senta里用到的bert模型

BERT的全称为Bidirectional Encoder Representation from Transformers，是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练，而是采用新的 masked language model（MLM），以致能生成 深度的双向语言表征。

该模型有以下主要优点：

1）采用MLM对双向的Transformers进行预训练，以生成深层的双向语言表征。

2）预训练后，只需要添加一个额外的输出层进行fine-tune，就可以在各种各样的下游任务中取得state-of-the-art的表现。在这过程中并不需要对BERT进行任务特定的结构修改。

Bert model类定了几个相关函数

第一个是init函数用来进行Bert的基本初始化操作

第二个函数-build-model 用来构建基本模型

第三个函数是get-sequence-output，用来获取句段的输出返回self.-enc-out文件里的值

第五个定义的函数是get-pretraining-output 用来获得预训练的损失和准确性

最后附上查阅的相关资料的网址

什么是BERT？ – 知乎 (zhihu.com)

1810.04805.pdf (arxiv.org)

The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

Original: https://blog.csdn.net/qq_46189653/article/details/122104326
Author: ZeYuyyyy
Title: 山东大学软件工程应用与实践—-SENTA代码分析（十）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531319/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Docker 搭建多容器组合服务 (nginx + PHP)

Docker 安装 PHP docker pull php:7.4-fpm (拉取指定版本的 php ） docker images （查看本地 php 镜像是否安装成功）准备好…

大数据 2023年5月29日
0078
Sqoop

SQOOP安装及使用 SQOOP安装及使用 – SQOOP安装 1、上传并解压 2、修改文件夹名字 3、修改配置文件 4、修改环境变量 5、添加MySQL连接驱动 6、…

大数据 2023年5月26日
00102
基于Andriod的简易记事本APP设计与实现

本设计完成后，能够实现以下功能： (1)设计实现”添加新记事”,”编辑内容”,”保存和删除当前记事”这三个主…

大数据 2023年11月12日
0054
JVM调优实践

JVM调优是一个非常依赖实践的工作，本文就是在某些场景下对JVM调优方法的整理。 CPU占用高是我们在线上会遇到的场景。出现这种情况，我们首先需要定位消耗CPU资源的代码。我们以…

大数据 2023年5月28日
0059
Flask_Bootstrap框架表单模板【Flask企业课学习】

推荐文章很多小伙伴都发现了，用户自主「申请上首页」的按钮取消了，那博主们写的文章还有上首页曝光的机会吗？我们的回答是”当然有！！！”虽然我们取消了上首页申…

大数据 2023年5月26日
0078
索引的建立与理解（什么情况下不用？为什么？）（保姆级理解）

一：索引的建立 import pandas as pd import sqlite3 conn=sqlite3.connect(‘new.db’) cur=conn.cursor(…

大数据 2023年11月11日
0065
utuntu20 在vmware中挂起后docker 网络断线

安装在vmware里的ubuntu20 ，挂起，恢复后，网络就断了参考 https://gist.github.com/lanrat/458066dbdeb460b9cef40d…

大数据 2023年5月29日
00108
Kubernetes集群部署

镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、环境要求系统版本：CentOS7.x版本硬件配置：内存2GB以上 cpu2核以上硬盘大于30G 集群网络配置：集群内所…

大数据 2023年5月27日
0082
论文解读UNITER: UNiversal Image-TExt Representation Learning

论文解读UNITER: UNiversal Image-TExt Representation Learning 简介结构解读预训练方法简介论文链接: link. 以后争取…

大数据 2023年5月28日
0087
linux操作系统配置静态IP大全

一、ubuntu14.04/16.04 用ifconfig -a查看有哪些网卡编辑配置文件sudo vim /etc/network/interfaces auto loifac…

大数据 2023年5月26日
0071
mysql主从搭建

1配置准备安装使用普通用户(本次安装统一使用mysql用户)，安装包使用mysql-5.7.35-el7-x86_64.tar.gz解压版安装。 Mysql 5.7.3的安装配置…

大数据 2023年6月3日
0077
__declspec(novtable) 的用法

__declspec(novtable) 在C++中接口中广泛应用. 不容易看到它是因为在很多地方它都被定义成为了宏. 比如说ATL活动模板库中的ATL_NO_VTABLE, 其实…

大数据 2023年6月3日
0068
Hive的安装与配置——第2关：Hive Shell入门基础命令

第2关：Hive Shell入门基础命令任务描述本关任务：按照编程要求，在 Hive下创建表。相关知识 Hive Shell运行在 Hadoop集群环境上，是 Hive提供的…

大数据 2023年11月12日
0043
【一起学SQLite】–Delphi下的SQLite之简介(3)

呵， Delphi，又是这个家伙！没办法，之前搞Delphi，隔了N年后又回来搞Delphi，对她也是又爱又狠…，主要是用来用去，还是前女友好，用起来舒服、贴心且省事，…

大数据 2023年11月10日
0039
python 调用c语言函数

虽然python是万能的，但是对于某些特殊功能，需要c语言才能完成。这样，就需要用python来调用c的代码了具体流程：c编写相关函数，编译成库然后在python中加载这些库，指…

大数据 2023年6月3日
0073
Hadoop HDFS操作命令总结

Hadoop HDFS操作命令总结 1.列出根目录下所有的目录或文件 hadoop fs -ls / 2.列出/logs目录下的所有目录和文件 hadoop fs -ls /log…

大数据 2023年5月24日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

山东大学软件工程应用与实践—-SENTA代码分析（十）

大家都在看