中文实体命名识别工具使用汇总：Stanza、LAC、Ltp、Hanlp、foolnltk、NLTK、BosonNLP

2023年6月1日上午8:53 • 人工智能 • 阅读 93

实体命名识别

; Stanford CoreNLP 命名实体识别

一、简介：

CoreNLP是Java自然语言处理的一站式服务！CoreNLP使用户能够导出文本的语言注释，包括标记和句子边界、词性、命名实体、数值和时间值、依赖和选区解析、共指、情感、引用属性和关系。CoreNLP的核心是管道。管道接收原始文本，对文本运行一系列NLP注释器，并生成最终的注释集。管道产生核心文档，包含所有注释信息的数据对象，可以通过简单的API访问，并且可以序列化到Google协议缓冲区。

中文语料模型包中有一个 默认的配置文件

StanfordCoreNLP-chinese.properties

指定pipeline的操作步骤以及对应的语料文件的位置，可以自定义配置文件，再引入代码中。实际上我们可能用不到所有的步骤，或者要使用不同的语料库，因此可以自定义配置文件，然后再引入。那在我的项目中，我就直接读取了该properties文件。（有时候我们只想使用ner功能，但不想使用其他功能，想去掉。然而，Stanford CoreNLP有一些局限，就是在ner执行之前，一定需要tokenize, ssplit, pos, lemma 的引入，大大增加了耗时。）

更多用法参见官网。

二、java版本使用

idea+maven搭建工程

1、在pom.xml 添加依赖：

<properties>
    <corenlp.version>3.9.1corenlp.version>
properties>

<dependencies>

    <dependency>
        <groupId>edu.stanford.nlpgroupId>
        <artifactId>stanford-corenlpartifactId>
        <version>${corenlp.version}version>
    dependency>

    <dependency>
        <groupId>edu.stanford.nlpgroupId>
        <artifactId>stanford-corenlpartifactId>
        <version>3.9.1version>
        <classifier>modelsclassifier>
    dependency>

    <dependency>
        <groupId>edu.stanford.nlpgroupId>
        <artifactId>stanford-corenlpartifactId>
        <version>${corenlp.version}version>
        <classifier>models-chineseclassifier>
    dependency>
dependencies>

2、编写java程序

package com;

import java.util.List;
import java.util.Map;
import java.util.Properties;

import edu.stanford.nlp.coref.CorefCoreAnnotations;
import edu.stanford.nlp.coref.data.CorefChain;
import edu.stanford.nlp.ling.CoreAnnotations;
import edu.stanford.nlp.ling.CoreLabel;
import edu.stanford.nlp.pipeline.Annotation;
import edu.stanford.nlp.pipeline.StanfordCoreNLP;
import edu.stanford.nlp.semgraph.SemanticGraph;
import edu.stanford.nlp.semgraph.SemanticGraphCoreAnnotations;
import edu.stanford.nlp.trees.Tree;
import edu.stanford.nlp.trees.TreeCoreAnnotations;
import edu.stanford.nlp.util.CoreMap;

public class StanfordChineseNlpExample2 {

    public static void main(String[] args) throws  Exception {
        StanfordChineseNlpExample2 nlp=new StanfordChineseNlpExample2();
        nlp.test();
    }

    public void test() throws Exception {

        StanfordCoreNLP pipeline = new StanfordCoreNLP("StanfordCoreNLP-chinese.properties");
        String text = "袁隆平是中国科学院的院士,他于2009年10月到中国山东省东营市东营区永乐机场附近承包了一千亩盐碱地,";

        long startTime = System.currentTimeMillis();

        Annotation document = new Annotation(text);

        pipeline.annotate(document);

        List<CoreMap> sentences = document.get(CoreAnnotations.SentencesAnnotation.class);
        for (CoreMap sentence : sentences) {

            for (CoreLabel token : sentence.get(CoreAnnotations.TokensAnnotation.class)) {

                String word = token.get(CoreAnnotations.TextAnnotation.class);
                System.out.println(word);

                String pos = token.get(CoreAnnotations.PartOfSpeechAnnotation.class);
                System.out.println(pos);

                String ne = token.get(CoreAnnotations.NormalizedNamedEntityTagAnnotation.class);
                String ner = token.get(CoreAnnotations.NamedEntityTagAnnotation.class);
                System.out.println(word + " | analysis : {  original : " + ner + "," + " normalized : "
                        + ne + "}");

                String lema = token.get(CoreAnnotations.LemmaAnnotation.class);
                System.out.println(lema);
            }

            Tree tree = sentence.get(TreeCoreAnnotations.TreeAnnotation.class);
            System.out.println("句子的解析树:");
            tree.pennPrint();

            SemanticGraph graph =
                    sentence.get(SemanticGraphCoreAnnotations.CollapsedCCProcessedDependenciesAnnotation.class);
            System.out.println("句子的依赖图");
            System.out.println(graph.toString(SemanticGraph.OutputFormat.LIST));
        }

        long endTime = System.currentTimeMillis();
        long time = endTime - startTime;
        System.out.println("The analysis lasts " + time + " seconds * 1000");

        Map<Integer, CorefChain> corefChains = document.get(CorefCoreAnnotations.CorefChainAnnotation.class);
        if (corefChains == null) {
            return;
        }
        for (Map.Entry<Integer, CorefChain> entry : corefChains.entrySet()) {
            System.out.println("Chain " + entry.getKey() + " ");
            for (CorefChain.CorefMention m : entry.getValue().getMentionsInTextualOrder()) {

                List<CoreLabel> tokens = sentences.get(m.sentNum - 1).get(CoreAnnotations.TokensAnnotation.class);

                System.out.println(
                        "  " + m + ", i.e., 0-based character offsets [" + tokens.get(m.startIndex - 1).beginPosition()
                                +
                                ", " + tokens.get(m.endIndex - 2).endPosition() + ")");
            }
        }
    }
}

实体识别结果：

袁隆平 | analysis : {  original : PERSON, normalized : null}
是 | analysis : {  original : O, normalized : null}
中国 | analysis : {  original : ORGANIZATION, normalized : null}
科学院 | analysis : {  original : ORGANIZATION, normalized : null}
的 | analysis : {  original : O, normalized : null}
院士 | analysis : {  original : TITLE, normalized : null}
, | analysis : {  original : O, normalized : null}
他 | analysis : {  original : O, normalized : null}
于 | analysis : {  original : O, normalized : null}
2009年 | analysis : {  original : DATE, normalized : 2009-10-XX}
10月 | analysis : {  original : DATE, normalized : 2009-10-XX}
到 | analysis : {  original : O, normalized : null}
中国 | analysis : {  original : COUNTRY, normalized : null}
山东省 | analysis : {  original : STATE_OR_PROVINCE, normalized : null}
东营市 | analysis : {  original : CITY, normalized : null}
东营区 | analysis : {  original : FACILITY, normalized : null}
永乐 | analysis : {  original : FACILITY, normalized : null}
机场 | analysis : {  original : FACILITY, normalized : null}
附近 | analysis : {  original : O, normalized : null}
承包 | analysis : {  original : O, normalized : null}
了 | analysis : {  original : O, normalized : null}
一千 | analysis : {  original : NUMBER, normalized : 1000}
亩 | analysis : {  original : O, normalized : null}
盐 | analysis : {  original : O, normalized : null}
碱地 | analysis : {  original : O, normalized : null}
, | analysis : {  original : O, normalized : null}
The analysis lasts 989 seconds * 1000

大概可以识别到的类型有：人person、数字number、组织organization、头衔title、省/市/区/位置province/city/facility/location、日期/时间date/time

实时在线演示：https://corenlp.run/

三、python版本使用

安装斯坦福大学NLP组的Stanza 。（要求：Python3.6及以上的版本）

pip install stanza

下载中文模型打包文件

import stanza
stanza.download('zh')

出现问题： [WinError 10054] 远程主机强迫关闭了一个现有的连接。
解决方法：用梯子

使用


import stanza

zh_nlp = stanza.Pipeline('zh', use_gpu=False)
text = "马云在1998年7月31日出生于江苏省盐城市大丰区。"

doc = zh_nlp(text)
for sent in doc.sentences:
    print("Sentence：" + sent.text)
    print("Tokenize：" + ' '.join(token.text for token in sent.tokens))
    print("UPOS: " + ' '.join(f'{word.text}/{word.upos}' for word in sent.words))
    print("XPOS: " + ' '.join(f'{word.text}/{word.xpos}' for word in sent.words))
    print("NER: " + ' '.join(f'{ent.text}/{ent.type}' for ent in sent.ents))

Sentence&#xFF1A;&#x9A6C;&#x4E91;&#x5728;1998&#x5E74;7&#x6708;31&#x65E5;&#x51FA;&#x751F;&#x4E8E;&#x6C5F;&#x82CF;&#x7701;&#x76D0;&#x57CE;&#x5E02;&#x5927;&#x4E30;&#x533A;&#x3002;
Tokenize&#xFF1A;&#x9A6C;&#x4E91; &#x5728; 1998 &#x5E74; 7 &#x6708; 31 &#x65E5; &#x51FA;&#x751F; &#x4E8E; &#x6C5F;&#x82CF; &#x7701; &#x76D0;&#x57CE; &#x5E02; &#x5927;&#x4E30; &#x533A; &#x3002;
UPOS: &#x9A6C;&#x4E91;/PROPN &#x5728;/ADP 1998/NUM &#x5E74;/NOUN 7/NUM &#x6708;/NOUN 31/NUM &#x65E5;/NOUN &#x51FA;&#x751F;/VERB &#x4E8E;/ADP &#x6C5F;&#x82CF;/PROPN &#x7701;/PART &#x76D0;&#x57CE;/PROPN &#x5E02;/PART &#x5927;&#x4E30;/PROPN &#x533A;/PART &#x3002;/PUNCT
XPOS: &#x9A6C;&#x4E91;/NNP &#x5728;/IN 1998/CD &#x5E74;/NNB 7/CD &#x6708;/NNB 31/CD &#x65E5;/NNB &#x51FA;&#x751F;/VV &#x4E8E;/IN &#x6C5F;&#x82CF;/NNP &#x7701;/SFN &#x76D0;&#x57CE;/NNP &#x5E02;/SFN &#x5927;&#x4E30;/NNP &#x533A;/SFN &#x3002;/.

NER: &#x9A6C;&#x4E91;/PERSON 1998&#x5E74;7&#x6708;31&#x65E5;/DATE &#x6C5F;&#x82CF;/GPE &#x76D0;&#x57CE;/GPE &#x5927;&#x4E30;/GPE

NLTK 命名实体识别

一、简介：

NLTK对于自然语言处理有很多开箱即用的API，本文主要介绍如何使用NLTK进行中文命名实体识别。由于NLTK不支持中文分词，所以本文使用了结巴分词。

二、搭建环境

环境：windows64+python3

前提：安装好python3，并且安装了numpy、matplotlib、pandas等一些常用的库

1、安装PyYAML模块和nltk模块

 pip install pyyaml nltk

2、下载NLTK的数据包

方式一：界面下载

在pycharm中写一个python脚本，如下：

import nltk
nltk.download()

运行脚本，出现如下界面，选择all，设置下载路径，点击下载：

中文实体命名识别工具使用汇总：Stanza、LAC、Ltp、Hanlp、foolnltk、NLTK、BosonNLP

下载时间很长，如果有个别数据包无法下载，可切换到 All Packages标签页，双击指定的包来进行下载。

方式二：命令行下载

创建名称为 nltk_data 的文件夹（比如我创建在了anacondas的目录下）

文件夹位置要求，程序会按照如下顺序去找该文件夹，所以，你创建的文件夹在以下目录即可：

Searched in:

‘C:\Users\10840/nltk_data’
‘D:\develop\python\Anaconda3\nltk_data’
- ‘D:\develop\python\Anaconda3\share\nltk_data’
- ‘D:\develop\python\Anaconda3\lib\nltk_data’
- ‘C:\Users\10840\AppData\Roaming\nltk_data’
- ‘C:\nltk_data’
- ‘D:\nltk_data’
- ‘E:\nltk_data’
- ‘ ‘

cmd 进入 nltk_data 文件夹目录，执行命令 python -m nltk.downloader all

关于下载的问题：

[win error 10054] &#x8FDC;&#x7A0B;&#x4E3B;&#x673A;&#x5F3A;&#x8FEB;&#x5173;&#x95ED;&#x4E86;&#x4E00;&#x4E2A;&#x73B0;&#x6709;&#x7684;&#x8FDE;&#x63A5;

解决方法：1.使用梯子 2.从国内别人上传的云盘下载（文末链接中有）3. 直接到官网下载数据包。

只要将下载的数据包复制到你的 Download Directory目录下即可

三、nltk使用

用NLTK来实现文本信息提取的方法，包含4步：分词，词性标注，（分块）命名实体识别，实体关系识别。

分块可以简单的基于经验，使用正则表达式来匹配，也可以使用基于统计的分类算法来实现，NLTK有提供基于正则的分块器。

nltk 不提供中文分词。

1、英文实体命名初体验

import sys
import importlib
importlib.reload(sys)
import nltk

article = "I came to Tsinghua University in Beijing"
tokens = nltk.word_tokenize(article)
print("tokens",tokens)
'''
tokens ['I', 'came', 'to', 'Tsinghua', 'University', 'in', 'Beijing']
'''

tagged = nltk.pos_tag(tokens)
print("tagged",tagged)
'''
tagged [('I', 'PRP'), ('came', 'VBD'), ('to', 'TO'), ('Tsinghua', 'NNP'), ('University', 'NNP'), ('in', 'IN'), ('Beijing', 'NNP')]
'''

entities = nltk.chunk.ne_chunk(tagged)
print(entities)

'''
(S
  I/PRP
  came/VBD
  to/TO
  (ORGANIZATION Tsinghua/NNP University/NNP)
  in/IN
  (GPE Beijing/NNP))
'''

NLTK 采用的是宾州中文树库标记：

2、使用nltk来处理中文资料

nltk 目前只能比较好的处理英文和其他的一些拉丁语系。由于中文汉字一个挨一个，nltk不支持。

所以可以采用其他分词工具对中文语料进行处理，再使用nltk对其进行实体识别。

分词工具有很多，这里使用 结巴分词。主页有详细介绍

结巴分词使用

1、安装

pip install jieba

2、使用：中文分词初体验


import jieba

jieba.enable_paddle()
strs=["我来到北京清华大学","乒乓球拍卖完了","中国科学技术大学"]
for str in strs:
    seg_list = jieba.cut(str,use_paddle=True)
    print("Paddle Mode: " + '/'.join(list(seg_list)))

seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("【全模式】: " + "/ ".join(seg_list))

seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("【精确模式】: " + "/ ".join(seg_list))

seg_list = jieba.cut("他来到了网易杭研大厦")
print("【新词识别】: "+", ".join(seg_list))

seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所，后在日本京都大学深造")
print("【搜索引擎模式】: "+", ".join(seg_list))

'''
Paddle Mode: 我/来到/北京清华大学
Paddle Mode: 乒乓球/拍卖/完/了
Paddle Mode: 中国科学技术大学

【全模式】: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学
【精确模式】: 我/ 来到/ 北京/ 清华大学
【新词识别】: 他, 来到, 了, 网易, 杭研, 大厦
【搜索引擎模式】: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, ，, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造
'''

这样，把分词的结果输出到文件中，NLTK就可以拿来做实体识别了，比如下面：


import sys
import importlib
importlib.reload(sys)
import nltk

tokens = nltk.word_tokenize("我 来到 北京 清华大学")
print("tokens",tokens)
tagged = nltk.pos_tag(tokens)
print("tagged",tagged)
entities = nltk.chunk.ne_chunk(tagged)
print(entities)

'''
tokens ['我', '来到', '北京', '清华大学']
tagged [('我', 'JJ'), ('来到', 'NNP'), ('北京', 'NNP'), ('清华大学', 'NN')]
(S 我/JJ 来到/NNP 北京/NNP 清华大学/NN)
'''

参考资料：
python的nltk中文使用和学习资料汇总帮你入门提高
 NLTK学习之四：文本信息抽取

foolnltk 命名实体识别

一、简介

foolnltk一个基于 深度学习的中文分词工具，具有以下特点：

可能不是最快的开源中文分词，但很可能是最准的开源中文分词
基于 BiLSTM 模型训练而成
包含分词，词性标注，实体识别, 都有比较高的准确率
用户 自定义词典
可以 *定制自己的模型

有python版本和java版本，详情请见

二、python版本使用

1、安装

pip install foolnltk

2、使用

#coding utf-8
import fool
import os

分词
text = "我来到北京清华大学"
print(fool.cut(text))
'''
[['我', '来到', '北京', '清华大学']]
'''

用户自定义词典
词典格式格式如下，词的权重越高，词的长度越长就越越可能出现, 权重值请大于 1
难受香菇 10
什么鬼 10
分词工具 10
北京 10
北京天安门 10
fool.load_userdict(os.getcwd()+'\\mydictionary')

词性标注
print(fool.pos_cut(text))
'''
[[('我', 'r'), ('来到', 'v'), ('北京', 'ns'), ('清华大学', 'nt')]]
'''

实体识别
words, ners = fool.analysis(text)
print(ners)
'''
[[(3, 9, 'org', '北京清华大学')]]
'''

Ltp 实体命名识别

一、简介

哈工大的LTP，免费使用但限流量，需要给钱才行

LTP4文档，啊！其实官方文档里面已经写的清清楚楚了！

这个也能支持用户自定义词典

二、使用

1、安装

pip install ltp

2、使用

import os
from ltp import LTP

ltp = LTP()  # 默认加载 Small 模型
user_dict.txt 是词典文件， max_window是最大前向分词窗口
ltp.init_dict(path=os.getcwd()+'\\mydictionary', max_window=4)

seg, hidden = ltp.seg(["马云在1996年11月29日来到杭州的阿里巴巴公司。"])  # 分词
print(seg)
'''
[['马云', '在', '1996年', '11月', '29日', '来到', '杭州', '的', '阿里巴巴', '公司', '。']]
'''

pos = ltp.pos(hidden)  # 词性标注
print(pos)
'''
[['nh', 'p', 'nt', 'nt', 'nt', 'v', 'ns', 'u', 'nz', 'n', 'wp']]
'''

ner = ltp.ner(hidden)  # 命名实体识别
tag, start, end = ner[0][0]
print(ner)
for tag, start, end in ner[0]:
    print(tag, ":", "".join(seg[0][start:end + 1]))
'''
[[('Nh', 0, 0), ('Ns', 6, 6), ('Ni', 8, 9)]]
Nh : 马云
Ns : 杭州
Ni : 阿里巴巴公司
'''

LTP 提供最基本的三种实体类型 人名 Nh、 地名 Ns、 机构名 Ni 的识别。

LAC 实体命名

LAC项目地址

一、简介

LAC全称Lexical Analysis of Chinese，是百度自然语言处理部研发的一款联合的词法分析工具，实现中文分词、词性标注、专名识别等功能。该工具具有以下特点与优势：

效果好：通过深度学习模型联合学习分词、词性标注、专名识别任务，词语重要性，整体效果F1值超过0.91，词性标注F1值超过0.94，专名识别F1值超过0.85，效果业内领先。
效率高：精简模型参数，结合Paddle预测库的性能优化，CPU单线程性能达800QPS，效率业内领先。
可定制：实现简单可控的干预机制，精准匹配用户词典对模型进行干预。词典支持长片段形式，使得干预更为精准。
调用便捷： 支持一键安装，同时提供了Python、Java和C++调用接口与调用示例，实现快速调用和集成。
支持移动端: 定制超轻量级模型，体积仅为2M，主流千元手机单线程性能达200QPS，满足大多数移动端应用的需求，同等体积量级效果业内领先。

二、python版本使用

1、安装

pip install lac

2、使用

from LAC import LAC

lac = LAC(mode='lac')

text = u"马云来到北京清华大学"
lac_result = lac.run(text)
print(lac_result)
'''
[['马云', '来到', '北京清华', '大学'], ['PER', 'v', 'ORG', 'n']]
'''

texts = [u"LAC是个优秀的分词工具", u"百度是一家高科技公司"]
lac_result = lac.run(texts)
print(lac_result)
'''
[[['LAC', '是', '个', '优秀', '的', '分词', '工具'], ['nz', 'v', 'q', 'a', 'u', 'n', 'n']],
 [['百度', '是', '一家', '高科技', '公司'], ['ORG', 'v', 'm', 'n', 'n']]]
'''

控制台输出以上内容，这个是初始化异常日志，不碍事，不喜欢的可以通过升级 paddlepaddle 版本到1.8以上来关闭

pip install paddlepaddle==1.8

词性和专业名词类别：（专业名词只能识别4种：人物、地名、机构名、时间）

BosonNLP 实体识别

这个现在官方不给 SDK 的 tooken 了，所以不能用了，但是在线演示平台挺绚丽的。

bosonnlp的SDK文档

一、简介

BosonNLP实体识别引擎基于自主研发的结构化信息抽取算法，F1分数达到81%，相比于StanfordNER高出7个百分点。通过对行业语料的进一步学习，可以达到更高的准确率。

二、python版本使用

1、安装

pip install bosonnlp

2、使用

from bosonnlp import BosonNLP
import os
nlp = BosonNLP(os.environ['BOSON_API_TOKEN'])
nlp.ner('杨超越在1998年7月31日出生于江苏省盐城市大丰区。', sensitivity=2)

Hanlp 实体识别

pyhanlp 项目官方地址

一、简介

HanLP是一系列模型与算法组成的NLP工具包，目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验。目前，基于深度学习的HanLP 2.0正处于alpha测试阶段，未来将实现知识图谱、问答系统、自动摘要、文本语义相似度、指代消解、三元组抽取、实体链接等功能。

我们介绍的Pyhanlp是HanLP1.x的Python接口，支持自动下载与升级HanLP1.x，兼容py2、py3。

二、python版本使用

1、安装

安装JDK

JDK官方下载地址
 JDK的安装与环境变量配置
注意保证JDK的位数、操作系统位数和Python位数一致。

安装Pyhanlp

pip install pyhanlp

2、使用


import pyhanlp
text = '杨超越在1998年7月31日出生于江苏省盐城市大丰区。'
NLPTokenizer = pyhanlp.JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')
NER = NLPTokenizer.segment(text)
print(NER)
'''
[杨超越/nr, 在/p, 1998年7月31日/t, 出生/v, 于/p, 江苏省盐城市/ns, 大丰区/ns, 。/w]
'''

不像前面介绍的几个工具可以直接获得实体，hanlp需要从词性标注里面提取实体，
人名nr、地名ns、机名nt、时间t。

Original: https://blog.csdn.net/weixin_37913042/article/details/112723589
Author: cici_iii
Title: 中文实体命名识别工具使用汇总：Stanza、LAC、Ltp、Hanlp、foolnltk、NLTK、BosonNLP

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/555938/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SCRDet++

SCRDet++ Detection for Small, Cluttered and Rotated Objects via Instance-Level Feature Den…

人工智能 2023年7月10日
0088
Matlab作图后的各种调整方法——线条、坐标、标题、图例

Matlab作图后的各种调整方法——线条、坐标、标题、图例文章目录 Matlab作图后的各种调整方法——线条、坐标、标题、图例一，写在前面 * 1.整个图窗 Figure（…

人工智能 2023年6月17日
0077
选择性注意中的“salience map”的作用是什么？

“salience map”即显著性图谱，代表了相应视觉场景的视觉显著性[1]。显著性图谱最早由Koch和Ullman针对选择性注意的自下而上加工方式提出。…

人工智能 2023年6月1日
0087
【EfficientNet】EfficientNet网络结构及代码详解

文章目录 1 从三个问题出发 2 MBConv结构解析 3 网络详细结构 4 EfficientNet-B0~B7结构解读 5 代码解读 6 感谢链接 1 从三个问题出发对于一个…

人工智能 2023年6月17日
0084
Activity启动流程(基于Android26)，Android开发必须要会

// 源 Activity 记录，即在哪个 Activity 进行 startActivityActivityRecord sourceRecord = null;// 如果使用 …

人工智能 2023年5月25日
0073
12.WPF动画

12.WPF动画动画的就是在UI元素上施加一些Timeline实例。WPF把简单的动画称为AnimationTimeline，复杂的动画称为Storyboard。 ; 简单的独立…

人工智能 2023年6月29日
0073
用于分类的神经网络算法,神经网络算法三大类型

常见的数据挖掘方法有哪些数据挖掘的常用方法有：神经网络方法神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题，因此近年来越…

人工智能 2023年7月13日
0060
趁热打铁，再构建百万节点关系中药方剂知识图谱

趁热打铁，再构建百万节点关系中药方剂知识图谱前文自顶向下构建中药知识图谱初探中，已经介绍了知识图谱和中药知识图谱构建的相关基础概念，本文将研究中药方剂数据，趁热打铁，再构建百万节…

人工智能 2023年6月1日
0086
数据挖掘绪论笔记（一）

数据挖掘的主要内容 1.数据分类和数据聚类的概念如何区别？分类：是把不同的事物，进行区分，把其中属于一类的物品划分在一起聚类：是在不同的事物中，相似度非常接近的物品划分在一起 …

人工智能 2023年5月31日
0076
我为何在 CSDN 乐在其中

文章目录写在前面成为博主究竟能得到什么？ * 内在提升耀眼名片丰富眼界提升知名度博客=》变现写在最后写在前面各位伙伴大家好，我是几何心凉，一位不是很大的也不是很小…

人工智能 2023年7月29日
0047
python中 .reshape 的用法：reshape(1,-1)

reshape(1,-1)转化成1行： reshape(2,-1)转换成两行： reshape(-1,1)转换成1列： reshape(-1,2)转化成两列 reshape(2,8…

人工智能 2023年7月6日
00262
Jenkins详细安装配置部署–超详细

Jenkins详细安装配置部署–超详细一、什么是CI/CD 二、Gitlab内置持续集成 * 持续集成（CI）持续交付（CD） 2.1 Gitlab的CI/CD优势…

人工智能 2023年6月26日
0069
手把手带你Yolov5 (v6.1)添加注意力机制(二)（在C3模块中加入注意力机制）

🌟想了解更多YOLO系列算法更多进阶教程欢迎订阅我的专栏🌟 基础不好的同学可以试试看一下我的《目标检测蓝皮书》🚀 ，里面包含超多目标检测实用知识，想速通目标检测，看这本就对了！ …

人工智能 2023年5月31日
00105
七种干豆类型预测分类报告加代码

题目：七种干豆类型预测分类数据集介绍干豆( Phaseolus vulgarisL.) 是世界许多地区的主食，加工使人们能够在日常饮食中消费和加入这种营养丰富的食物。国际食品…

人工智能 2023年7月28日
0062
Tesseract-OCR 下载安装和使用

7.完成安装 ; 四、设置环境变量 1.设置环境变量进入环境变量中，在path中新建tesseract的安装路径使用win+r弹出”运行”命令框，输入sy…

人工智能 2023年7月21日
0084
数据可视化之美 — 以Matlab、Python为工具

在我们科研、工作中，将数据完美展现出来尤为重要。数据可视化是以数据为视角，探索世界。我们真正想要的是 — 数据视觉，以数据为工具，以可视化为手段，目的是描述真实，探索世界。下面介绍…

人工智能 2023年7月5日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

中文实体命名识别工具使用汇总：Stanza、LAC、Ltp、Hanlp、foolnltk、NLTK、BosonNLP

实体命名识别

相关知识

; Stanford CoreNLP 命名实体识别

一、简介：

二、java版本使用

三、python版本使用

NLTK 命名实体识别

一、简介：

二、搭建环境

三、nltk使用

1、英文实体命名初体验

2、使用nltk来处理中文资料

结巴分词使用

foolnltk 命名实体识别

一、简介

二、python版本使用

Ltp 实体命名识别

一、简介

二、使用

LAC 实体命名

一、简介

二、python版本使用

BosonNLP 实体识别

一、简介

二、python版本使用

Hanlp 实体识别

一、简介

二、python版本使用

大家都在看