《知识图谱概念与技术》读书笔记：关系抽取中基于模式的抽取

2023年6月1日下午8:46 • 人工智能 • 阅读 55

读完可以回答以下问题：

基于模式的关系抽取定义是什么？
2.基于模式的关系抽取方法及各自的优缺点有哪些？
3.基于模式的关系抽取的质量评估方式有哪些？

1.基于模式的关系抽取通过定义在文本中表达的字符、语法或者语义模式，将模式与文本的匹配作为主要手段，来实现关系实例的抽取。

2.基于模式的关系抽取可以分为：

来自于专家定义的模式：

优缺点：质量精良，抽取准确率高。但是成本高昂，召回率低。

1）基于字符的模式：

表达特定关系的字符模式同时是一组正则表达式。对于模式和文本的相似性有较高的要求。当模式具有一定的泛化模式时，容易引入更多的错误。

2）基于语法的模式：

基于语法的模式能够增强模式的表达能力，语法包括词法(引入词性标签等)和句法。这种模式构造容易，且有较好的准确率。

3）基于语义的模式：

优化语法模式的一种重要手段就是引入语义元素（如概念），可以更加精准地表达模式适配的范围，从而增强模式的描述能力，从而实现高精度抽取。

引入概念的语义模式依赖于比较完善的概念图谱。但随着概念图谱的普及，这一模式也有着更加广泛的应用。

自动化模式抽取：

自举法（Bootstrapping）：”模式抽取+实体抽取”循环迭代，这个过程也称为”滚雪球（Snowball）”

步骤一：为该类关系类型标注少量初始种子实体对。

步骤二：找到实体对在文本语料库中所出现的句子集合。

步骤三：基于这些句子抽取表达关系的模式（模式抽取）。

步骤四：是用新发现的模式去语料库中抽取新的实体对（实体抽取）。

自举法的代表成果：DIPRE系统，Snowball系统，KnowItAll系统

优缺点：自动，高效。但质量不容易保证，例如：模式容易出现语义漂移，互联网的海量语料中存在很多噪声。

3.基于模式抽取的质量评估

质量评估通常从两个角度进行判断： 实例与模式的匹配程度，以及 模式本身的置信度。

在衡量实例和模式匹配时，完全匹配少之又少。因此，通常使用模糊匹配的度量指标Jaccard相似度、编辑距离、加权匹配等分数。

模式本身的置信度可以通过在实际匹配中的表现来评估。通常使用准确率作为置信度的度量。

Original: https://blog.csdn.net/pony1001/article/details/112515441
Author: Tina Tang
Title: 《知识图谱概念与技术》读书笔记：关系抽取中基于模式的抽取

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558443/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言sqrt函数为数值开平方根实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月16日
0071
【pyspark】DataFrame基础操作（一）

介绍一下 pyspark 的 DataFrame 基础操作。一、DataFrame创建创建 pyspark 的 DataFrame 的方式有很多种，这边列举一些：通过 Row…

人工智能 2023年7月6日
0063
[源码笔记]Graph Convolutional Network(GCN) 图卷积网络源码详解

GCN源码详解参考：[Github源码] tkipf/pygcn: Graph Convolutional Networks in PyTorch (github.com)图神经…

人工智能 2023年6月3日
00100
【cartographer_ros】四：发布和订阅里程计odom信息

上一节介绍了激光雷达Scan传感数据的订阅和发布。本节会介绍里程计Odom数据的发布和订阅。里程计在cartographer中主要用于前端位置预估和后端优化。官方文档：http…

人工智能 2023年6月1日
00108
【MMML】多模态机器学习高被引综述论文笔记

论文名称：Multimodal Machine Learning: A Survey and Taxonomy论文下载：https://arxiv.org/abs/1705.094…

人工智能 2023年6月16日
0085
自然语言处理相关知识的构成

NLP 的基本术语为了帮助你更好地学习 NLP ，我们将逐一介绍 NLP 领域的一些基础专业词汇。1、分词( segment )词是最小的能够独立活动的有意义的语言成分，英文单词…

人工智能 2023年5月28日
0086
R语言使用glm函数构建logistic回归模型，使用forestmodel包的forest_model函数可视化逻辑回归模型对应的森林图

R语言使用glm函数构建logistic回归模型，使用forestmodel包的forest_model函数可视化逻辑回归模型对应的森林图目录 R语言使用glm函数构建logis…

人工智能 2023年6月19日
0086
论文阅读|HigherHRNet

HigherHRNet: Scale-Aware Representation Learning forBottom-Up Human Pose Estimation 参考资料：(…

人工智能 2023年7月10日
00134
哪款蓝牙耳机降噪效果好？降噪效果好的蓝牙耳机排行榜

降噪耳机哪款好?目前可是有着很多的用户都是非常喜欢戴耳机出门，毕竟现在出门基本都是带耳机的，可不会再带个麻烦的有线耳机了，所以大家对于耳机各方面性能要求也是很高的，那么蓝牙耳机到底…

人工智能 2023年5月27日
0097
[Raspberry Pi] Raspberry Pi 4配置OpenCV4.6.0和ncnn环境(32-bit operation system)

本教程参考如下几篇文章 1 调整GPU Memory 树莓派默认的GPU Memory大小有点小，需要手动增大。找到树莓派左下角和win类似的按钮->Preferences…

人工智能 2023年7月19日
0061
如果说数据是数字经济的新石油，那么人工智能（AI）就是蒸汽机

如果说数据是数字经济的新石油，那么人工智能（AI）就是蒸汽机。好似石油和蒸汽机为运输提供燃料，并推动工业革命一样，掌握数据与人工智能力量的公司同时也掌握着创新关键。2022年，数据…

人工智能 2023年7月17日
0074
KBQA简述

KBQA 知识图谱问答，又称 Knowledge-based QA 或 KBQA,是一种基于结构化知识库（即知识图谱）的智能问答方法。给定自然语言问题，该类方法基于知识图对问题进行…

人工智能 2023年7月28日
0065
时间序列分析（3）| ARMA模型的拟合

本篇来介绍根据已有的时间序列数据来拟合ARMA模型。需要说明的是不同阶数的ARMA模型可能近似或完全等价，因此模型估计的结果也不是唯一的；筛选标准通常遵守简练性原则。 1 arim…

人工智能 2023年6月11日
0082
两组回归系数差异检验_【stata系列】——组间系数差异检验

01 组间系数差异检验是什么？组间系数差异检验可以用于横截面中产权性质分析、高低分组分析等，在DID模型里也可用于检验post=0(或post=1)时组间系数差异，需要说明的是，…

人工智能 2023年6月18日
00189
Cartographer实时建图（个人定制版）

在先前已经完成了Cartographer离线建图，离线建图方案是，先在底盘主机中录制bag包，包括/scan、/odom、/tf话题，然后将bag包拷贝到从机中，也就是自己的电脑，…

人工智能 2023年6月1日
0077
LSTM学习记录

文章目录前言一、为什么要用LSTM？二、LSTM结构介绍 * 1.大体结构 2.三个门结构总结前言一些关于LSTM的学习记录。一、为什么要用LSTM？ LSTM（Lo…

人工智能 2023年7月14日
0063

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

《知识图谱概念与技术》读书笔记：关系抽取中基于模式的抽取

大家都在看