知识图谱de构建与应用(三):知识融合

本章首先介绍知识融合的定义、难点和流程,接着概括性地介绍本体对齐和实体对齐的常用方法,最后介绍知识融合在工业领域实践过程中的方法和评估体系。

3.1 知识融合概述

对于很多需要构建知识图谱的领域,由于从业者甚多,自然而然地会沉淀出数量众多的数据库或知识库,比如在影视子领域,百度百科、维基百科、豆瓣等都是很好的知识库,因而在构建知识图谱的过程中往往会对多个知识库的知识进行合并,以期获得最全面的知识,这个过程就称为知识融合。此外,由于被合并的各个知识库里的知识难免会存在错误,因而知识融合会对多个知识库的知识进行交叉验证,知识融合之后获得的知识相比融合前的单知识库会更准确。

由于自然语言的开放性,各个领域的知识融合任务往往面临以下四个难点。

(1)异构问题。不同知识库对同一个实体或知识的表达差异很大,具体体现在一个相同的实体存在大量的别名。如图3-1(a)所示,不同数据源对同一个实体”华为P30″有不同的描述。

(2)歧义问题。不同的实体使用同样或类似的文本表达。如图3-1(b)所示,在电商领域中,”苹果”既可以作为一个品类名称,也可以是一个品牌名称,甚至可以作为一种颜色或是图案名称出现。在工程实践中容易造成准确率的下降。

(3)数据噪声问题。在工业界知识图谱实践中,数据噪声问题是广泛存在的,多知识库融合会放大噪声问题,容易造成准确率的下降。如图3-1(c)所示,该商品实体的属性值很多是”不详

Original: https://blog.csdn.net/u013250861/article/details/125814758
Author: u013250861
Title: 知识图谱de构建与应用(三):知识融合

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/595898/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球