Stanford Corenlp

官网:https://stanfordnlp.github.io/CoreNLP/

【下载】纯英文处理即选择红色按钮进行下载,若需要对其它语言进行处理,下载相应安装包即可

注:Corenlp只能对单语言进行处理,不能同时处理两种以上文档。

Corenlp由JAVA编写,但存在可供Python调用的接口

【功能介绍】

CoreNLP 使用户能够为文本派生语言注释,包括标记和句子边界、词性、命名实体、数字和时间值、依赖和选区解析、共指、情感、引用属性和关系。

CoreNLP 目前支持 8 种语言:阿拉伯语、汉语、英语、法语、德语、匈牙利语、意大利语和西班牙语。

功能:

1.分词

nlp.word_tokenize(‘sentence’)

返回结果:列表[‘word1′,’word2′,…,’word n’]

2.词性标注

nlp.pos_tag(‘sentence’)

返回结果:列表[(‘word1′,’词性1’),(‘word2′,’词性2’),…,(‘word n’,’词性n’)]

Stanford Corenlp
  1. 命名实体标注

nlp.ner(‘sentence’)

Stanford Corenlp

4.句法分析

nlp.parse(‘sentence’)

返回结果:句法分析内层为词性标注,外层是与句子结构相关的标注

Stanford Corenlp

5.共指

Stanford Corenlp

【具体使用方法】

from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP(‘/home/lhl/software/stanford-corenlp-4.4.0’)
sentence = ‘i love this place’

分词

print(nlp.word_tokenize(sentence))

词性标注

print(nlp.pos_tag(sentence))

命名实体识别

print(nlp.ner(sentence))

句法依存分析

print(nlp.dependency_parse(sentence))

Original: https://blog.csdn.net/celialhl/article/details/123570170
Author: celialhl
Title: Stanford Corenlp

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/530095/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球