bert参数统计

2023年5月28日下午1:56 • 大数据 • 阅读 61

bert主要的实现是基于transformer的encoder部分，参数维度不同的地方是1）输入多了一项segment embedding，2）中间维度基本是768，以及多头注意力以及前向网络重复了12次。

在统计bert参数的时候，一共要考虑5部分。

1）第一部分：输入层包含三项

token embedding词表大小768position embmax_len(512768)segment emb两个取值0,1（2*768）

2）第二部分：多头注意力

12个头，其中每个头包括Q\K\V三组参数

768(原始维度)768/12（每个头的q\k\v的维度）3*12（头的个数）

然后concat起来所有输出，再变换一下 768*768+768

3）第三部分：Add and Norm

add不需要参数，norm有两个参数需要学习：shift和scale（2*768）

4）第四部分：前向网络

两层全连接网络（W,b）：第一层是768*3072（4H）+3072

第二层是3072*768+768

5）第五部分：Add and Norm

同第三部分：2*768

总参数：第一部分+12*（第二+第三+第四+第五部分）

Original: https://blog.csdn.net/baoyan2015/article/details/121206765
Author: samoyan
Title: bert参数统计

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531908/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

5分钟搭建1个智慧物流数据可视化大屏

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

大数据 2023年6月2日
0079
AutoWare.auto 与ROS2 亲测安装成功

镜像下载、域名解析、时间同步请点击阿里云开源镜像站 AutoWare.auto 安装实践 1. 相关程序版本说明 ubuntu版本：20.04 ADE：4.4.0 Autoware…

大数据 2023年5月27日
0070
3.构建自己的Ribbon功能菜单

愿你出走半生,归来仍是少年！环境：.NET FrameWork4.5、ObjectArx 2016 64bit、Entity Framework 6. 目录 1.Sqlite配置…

大数据 2023年11月11日
0044
linux中的重定向符和管道（<,><<,>>,|）

管道与重定向的使用标准输入的文件描述符为0. 标准输出的文件描述符为1 错误输出的文件描述符为2 管道：允许我们将多个命令连接在一起。 [En] Piping: allows u…

大数据 2023年5月27日
0062
sqlite3数据库之blob数据类型读写

sqlite3数据库之blob数据类型读写近期在开发过程中需要在数据库中保存二进制文件，于是去了解了一下sqlite3的数据类型，发现blob可以存储二进制数据。但是blob要如…

大数据 2023年11月11日
0061
BSS应用程序云原生部署的8大挑战

云原生部署改变了软件开发。根据云原生计算基金会(CNCF)2021年年度调查，96%的组织正在使用或评估Kubernetes。更确切地说，560万开发者在使用Kubernetes，…

大数据 2023年6月3日
0060
Kafka与Spark案例实践

1.概述 Kafka系统的灵活多变，让它拥有丰富的拓展性，可以与第三方套件很方便的对接。例如，实时计算引擎Spark。接下来通过一个完整案例，运用Kafka和Spark来合理完成。…

大数据 2023年6月3日
00110
ubuntu编译内核报错-couldn’t be accessed by user ‘_apt’. – pkgAcquire::Run (13: Permission denied)

现象在ubuntu上编译内核时， apt-get source时出现如下warning： W: Download is performed unsandboxed as root…

大数据 2023年5月27日
00123
微服务设计（五）—分布式配置中心与spring cloud stream

一、Spring Cloud Stream 在实际的企业开发中，消息中间件是至关重要的组件之一。消息中间件主要解决应用解耦，异步消息，流量削锋等问题，实现高性能，高可用，可伸缩和最…

大数据 2023年6月3日
0071
PostgreSQL逻辑复制解密

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

大数据 2023年6月2日
0078
基于DockerSwarm 部署InfluxDB并使用JAVA操作

Docker中部署InfluxDB 1、运行容器 $ docker run –rm \ -e INFLUXDB_DB=db0 -e INFLUXDB_ADMIN_ENABLED=…

大数据 2023年5月28日
0084
docker学习笔记

更改docker的默认存储路径 https://medium.com/developer-space/how-to-change-docker-data-folder-config…

大数据 2023年5月29日
0074
Redisson实现分布式锁

大数据 2023年11月15日
0043
IDEA使用JDBC连接Hive数据库代码

大数据 2023年11月13日
0050
关于sparksql中设置自定义自增列的相关要点（工作共踩过的坑-1）

小白终于进入了职场，从事大数据方面的工作！分到项目组了，搬砖的时候遇到了一个这样的问题。要求：用spark实现oracle的存储过程中计算部分。坑：由于报表中包含了一个ID字…

大数据 2023年6月3日
0084
spring boot profiles 实现多环境下配置切换 docker版

1，前言开发环境总需要调试，docker直接部署不需要调试，环境配置不一样，这里的目的只是，在docker文件环境与开发环境使用不同的配置文件，项目结构如下 2，设置项目配置文件…

大数据 2023年5月29日
00111

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

bert参数统计

大家都在看