keras_bert与bert4keras的使用

2023年5月28日下午1:49 • 大数据 • 阅读 68

keras_bert 是Cyberzhg 封装的Keras版Bert，可以直接调用官方发布的预训练权重。

pip install keras_bert

bert4keras 是苏剑林参考 keras-bert 重新编写的keras 版 bert，可 适配 albert

快速安装：pip install git+https://www.github.com/bojone/bert4keras.git

安装稳定版：pip install bert4keras

bert4keras支持Albert，bert4keras 可使用tensorflow2.2.0 + keras2.3.1

为了获得最好的体验，建议使用Tensorflow 1.14 + Keras 2.3.1组合。

关于环境组合

支持tf+keras和tf+tf.keras，后者需要提前传入环境变量TF_KERAS=1。
当使用tf+keras时，建议2.2.4
keras 2.4+可以用，但事实上keras 2.4.x基本上已经完全等价于tf.keras了，因此如果你要用keras 2.4+，倒不如直接用tf.keras。

在 keras-bert 里面，使用 Tokenizer 将文本 拆分成字并生成相应的id。

需要提供字典，存放 token 和 id 的映射，字典里还有 BERT 里特别的 token。

如果拆分的中文不存在字典中使用UNK代替，如果是英文则拆分成字母。

参考：

Original: https://blog.csdn.net/MarkAustralia/article/details/119821681
Author: Mark_Aussie
Title: keras_bert与bert4keras的使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531866/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SpringSecurity整合jwt

大数据 2023年11月14日
0044
Transformer学习

模型结构 Encoder Encoder是有N=6层的一个整体。是这6层按顺序走下来的一个整体。每层有两个子层。分别是多头自注意力和全连接前馈网络。对于每个子层，先采用残差连接，后…

大数据 2023年6月3日
0088
Linux下安装配置OpenResty服务器

OpenResty是一款基于Nginx和Lua的高性能Web平台，在nginx基础之上集成了大量的lua库，第三方模块等，以便搭建各种处理高并发、可扩展的Web应用、服务或网关，并…

大数据 2023年6月2日
0074
Hive CTE与子查询

CTE 功能上和子查询一样，可读性好些 mysql8才支持 Common Table Expression（公用表表达式）从 WITH 子句中指定的简单查询派生的临时结果集，在 …

大数据 2023年11月13日
0034
[Linux]红帽高级存储功能 – Stratis与VDO

Stratis 卷管理文件系统介绍特点使用 VDO 虚拟数据优化器介绍特点使用 Stratis 卷管理文件系统介绍红帽的 Stratis 是新一代的存储管理解决方案…

大数据 2023年5月27日
0086
数据库中DML,DDL,DCL,DQL指的是什么意思

1)DQL(Dimensional Query Language )数据查询语言DQL基本结构是由SELECT子句，FROM子句，WHERE子句组成的查询块：SELECT 2). …

大数据 2023年11月12日
0051
想法子记忆Vi/Vim常用操作及指令

本笔记有特殊目录，点击开启：专有目录在Linux系统中编辑文本总是离不开一位老帮手—— Vi。而因为其诞生的年代有些久远，有些操作在现在看来可能有点”反直觉&#82…

大数据 2023年5月27日
0075
redis的延迟双删策略总结

大数据 2023年11月14日
0041
[计算机网络]–代理服务器原理

代理服务器：代理服务器(Proxy Server)就是个人网络和因特网服务商之间的中间代理机构，它负责转发合法的网络信息，并对转发进行控制和登记。目前使用的因特网是一个典型的客户…

大数据 2023年5月24日
0072
Elasticsearch全文检索服务器介绍

1.概述 Elasticsearch本质是一个java语言开发的web项目，我们可以通过RESTful风格的接口访问该项目内部的Lucene，从而让全文搜索变得简单。 2. 正排索…

大数据 2023年5月25日
0057
elixir的phoenix环境配置

export HEX_MIRROR="https://hexpm.upyun.com" mix local.rebar 安装phoenix mix archiv…

大数据 2023年5月28日
0059
Spring Boot FAQ

eclipse 在marketPlace安装lombok, springtool4, dbeaver,docker tooling tomcat的端口,数据连接这些都存在resou…

大数据 2023年6月3日
0080
2022年最新版Android安卓面试题+答案精选（每日20题，持续更新中）【三】

; 前言写在前面：首先是不一次性放出来的原因：资料来之不易，希望大家好好珍惜，每天花一段时间细细的消化这些题目，其次希望大家在阅读题目的时候最好跟着书或者代码一起阅读、一起敲，做…

大数据 2023年11月11日
0037
Redis基础篇——Redis安装以及配置文件的修改

大数据 2023年11月15日
0033
生产环境 /dev/vda1文件满了导致redis无法写入问题分析以及df -h解析

大数据 2023年11月16日
0043
flink on native k8s by application mode

flink1.13于5月4日发布，版本迭代之快，更是体现了其势不可挡的发展速度。社区活跃度逐步攀升，当然少不了与云原生等技术的集成。本文主要讲解flink的原生k8s appli…

大数据 2023年6月3日
0089

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球