#保姆级# StanfordCoreNLP — 句法分析 + 可视化

2023年5月28日上午11:11 • 人工智能 • 阅读 81

句法分析（Constituency Parsing）是NLP领域非常重要、也是相对基础的解析任务。

句法分析的任务，就是解析出句子中的短语结构、短语之间的层次句法关系。

通过Stanford提供的CoreNLP，很容易实现句法分析。比如下面这句话：

which province is jack and john electorated in?

首先，我们可以通过斯坦福提供的在线网站 http://corenlp.run/ 对这句话进行解析，如下：

点击Submit后，可以constituency parse的结果：

那么，如何通过代码来实现呢？StanfordCoreNLP获取句法解析树的Java代码如下：

class NLPUtils{

    private static Properties properties = new Properties();
    private static StanfordCoreNLP pipeline;

    static{
        init();
    }

    /**
     * 成分分析、语法分析
     * @param singleNL
     */
    public static void constituencyAnalysis(String singleNL){
        if (StringUtils.isBlank(singleNL)){
            return;
        }
        CoreDocument document = getCoreDocument(singleNL);
        CoreSentence sentence = document.sentences().get(0);
        Tree constituencyParse = sentence.constituencyParse();
        System.out.println(constituencyParse);
    }

    /**
     * 获取 NL 的 CoreDocument 对象
     *
     * @param NL
     * @return
     */
    public static CoreDocument getCoreDocument(String NL) {
        return pipeline.processToCoreDocument(NL);
    }

    /*
     * 初始化
     * */
    private static void init() {
        properties.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,depparse,parse");
        properties.setProperty("ner.additional.regexner.ignorecase", "true");
        properties.setProperty("ner.applyNumericClassifiers", "true");
        properties.setProperty("ner.buildEntityMentions", "true");
        properties.setProperty("ner.useNERSpecificTokenization", "true");
        pipeline = new StanfordCoreNLP(properties);
    }

    public static void main(String[] args) {
        String singleNL = "which province is jack and john electorated in ?";
        constituencyAnalysis(NL);
    }
}

上面的代码执行结果如下：

(ROOT (SBARQ (WHNP (WDT which) (NN province)) (SQ (VBZ is) (NP (NP (NNP jack) (CC and) (NNP john)) (PP (NP (NNP electorated)) (IN in)))) (. ?)))

有兴趣的朋友可以通过代码将上面的结果转化为多叉树的结构。

【提示】

通过CoreSentence.constituencyParse()获取到解析树后，再去获取到它的iterator：

    Iterator iterator = constituencyParseTree.stream().iterator();
        while (iterator.hasNext()){
            Tree next = iterator.next();
            System.out.println(next);
            System.out.println(next.numChildren());
        }
    }

输入结果如下，将输入结果同文章开头的图进行比较，便可以得到一些思路：

(ROOT (SBARQ (WHNP (WDT which) (NN province)) (SQ (VBZ is) (NP (NP (NNP jack) (CC and) (NNP john)) (PP (NP (NNP electorated)) (IN in)))) (. ?)))
1
(SBARQ (WHNP (WDT which) (NN province)) (SQ (VBZ is) (NP (NP (NNP jack) (CC and) (NNP john)) (PP (NP (NNP electorated)) (IN in)))) (. ?))
3
(WHNP (WDT which) (NN province))
2
(WDT which)
1
which
0
(NN province)
1
province
0
(SQ (VBZ is) (NP (NP (NNP jack) (CC and) (NNP john)) (PP (NP (NNP electorated)) (IN in))))
2
(VBZ is)
1
is
0
(NP (NP (NNP jack) (CC and) (NNP john)) (PP (NP (NNP electorated)) (IN in)))
2
(NP (NNP jack) (CC and) (NNP john))
3
(NNP jack)
1
jack
0
(CC and)
1
and
0
(NNP john)
1
john
0
(PP (NP (NNP electorated)) (IN in))
2
(NP (NNP electorated))
1
(NNP electorated)
1
electorated
0
(IN in)
1
in
0
(. ?)
1
?
0

Original: https://blog.csdn.net/Elliot_Elliot/article/details/121505923
Author: 进击的Coder*
Title: #保姆级# StanfordCoreNLP — 句法分析 + 可视化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531151/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【三维目标检测】3DSSD（二）

本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为”https://blog.csdn.net/suiying…

人工智能 2023年7月9日
0068
【小程序-开篇】国内IT技术圈的技能树貌似点歪了？

欢迎来到我的博客📔博主是一名大学在读本科生，主要学习方向是前端。 🍭目前已经更新了【Vue】、【React–从基础到实战】、【TypeScript】等等系列专栏 🌈博客主页👉cod…

人工智能 2023年5月31日
0080
Python: 每日一题之第几个幸运数字

本题为填空题，只需要算出结果后，在代码中使用输出语句将所填结果输出即可。到 X 星球旅行的游客都被发给一个整数，作为游客编号。 X 星的国王有个怪癖，他只喜欢数字 3, 5 和 …

人工智能 2023年6月30日
0099
半监督回归(Semi-Supervised Regression, SSR)-论文整理

本文内容来自 Semi-Supervised Regression: A recent review SSR 的种类按照以下标准进行分类: 输入变量之间的关系参数估计(Param…

人工智能 2023年6月17日
0060
软件智能:aaas系统AI众生世界之24 主体间性和主体性

本篇回到哲学的一些基本问题上。关键词是：主体间性和主体性。前者是现象的诠释学范畴，后者是它的对立面–标志sign的符号学。可以将后者（标志符号学）视为象征手法，…

人工智能 2023年6月1日
0057
讯飞AIUI智能机器人3—来和机器互动吧（语音技术综合应用）

🍖🍖🍖🍖🍖🍖🍖🍖🍖 作者：不良使 🍖🍖🍖🍖🍖 潜力创作新星华为云享专家 🍖🍖🍖🍖🍖🍖 博客记录学习的思路，项目和错误,寻找志同道合的朋友 🍖🍖🍖🍖🍖🍖🍖 如果觉得有帮助记得一…

人工智能 2023年5月25日
0083
深度学习 Transformer架构解析

文章目录一、Transformer背景介绍 * 1.1 Transformer的诞生 1.2 Transformer的优势 1.3 Transformer的市场二、Transf…

人工智能 2023年7月31日
0044
损失函数-负对数似然和交叉熵(Pytorch中的应用)

文章目录 * – 1、负对数似然损失函数 – + 1.1、似然 + 1.2、似然函数 + 1.3、极大似然估计 + 1.4、对数似然 + 1.5、负对数似然…

人工智能 2023年7月22日
0044
软件智能：aaas文档主体标头标记法DSHN (续1）

1、DSHN的地位–某种理论集合的可及性accessibility的三种组织中站在中间的那一个 1.1 AI的词汇词、索引词和概念词（ad hoc，propter ho…

人工智能 2023年6月10日
0079
【机器学习-西瓜书】第5章神经网络

5.1 神经元模型定义：神经网络是由具有适应性的简单单元组成的、广泛并行互连的网络，其组织能够模拟神武神经系统对真实世界物体所做出的交互反应。这里的简单单元指神经元neuron…

人工智能 2023年7月14日
0061
机器学习笔记（三）

机器学习笔记（三）文章目录 * – 机器学习笔记（三） – + 线性模型简介 + 线性回归 + 线性几率回归线性模型简介线性模型最简单的案例是最小二乘…

人工智能 2023年6月15日
0072
Deep Multimodal Representation Learning（深度多模态表示学习）

多模态表示学习旨在缩小不同模态之间的异质性差距，在利用普遍存在的多模态数据中发挥着不可或缺的作用。基于深度学习的多模态表示学习由于具有强大的多层次抽象表示能力，近年来引起了人们的广…

人工智能 2023年6月18日
0093
实战cox经过age和sex多因素分析得到千个与生存相关基因cox_results然后lasso回归筛选基因得到9个基因然后计算risk_score 画roc曲线列线图森林图最优子集逐步回归

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月18日
00109
pytorch-将图片转成可训练的张量

import os 创建一个多图像的数据集作为神经网络的输入，以3为例，以获得一个NCH*W，预先分配一个适当大小的张量，并使用从目录中加载的图像填充它。 batch_size=3…

人工智能 2023年7月22日
0047
交通流预测爬坑记（三）：使用pytorch实现LSTM预测交通流

很长时间没有更新内容了，上一篇可以看做是刚接触深度学习写的，看法非常狭隘，内容非常粗糙。在最近的学习中接触到了Pytorch，不得不承认，相对于TensorFlow来讲，灵活很多。…

人工智能 2023年7月6日
0085
Tableau可视化–简单绘制雷达图

雷达图，也叫蜘蛛图、星图、网络图，是用于多维度分析的理想选择，例如运动员的综合水平的对比，各种商品参数的比较等等。雷达图在数据分析中是一种常用的图表，tableau上制作雷达图实…

人工智能 2023年7月17日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

#保姆级# StanfordCoreNLP — 句法分析 + 可视化

大家都在看