知识图谱 (1)基本概念

2023年6月1日下午9:02 • 人工智能 • 阅读 66

1 . 定义

知识图谱是由一些相互连接的实体和它们的属性构成的，是用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

用来揭示实体之间关系的语义网络

信息是指外部的客观事实。举例：这里有一瓶水，它现在是7°。
知识是对外部客观规律的归纳和总结。举例：水在零度的时候会结冰。

三元组：实体entity,实体关系relation,实体entity

几个过程

原始数据类型一般来说有三类（也是互联网上的三类原始数据）：

结构化数据（Structed Data）：如关系数据库
半结构化数据（Semi-Structed Data）：如XML、JSON、百科
非结构化数据（UnStructed Data）：如图片、音频、视频、文本

要做好KG要综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术。

2.1 知识抽取

信息抽取：从各种类型的半结构化、非结构化的数据源中提取出实体、属性以及实体间的相互关系，在此基础上形成本体化的知识表达；

2.1.1 结构化数据处理

针对结构化数据，通常是关系型数据库的数据，数据结构清晰，把关系型数据库中的数据转换为RDF数据（linked data），普遍采用的技术是D2R技术。

2.1.2 半结构化数据处理

半结构化数据：具有一定的数据结构，但需要进一步提取整理的数据。
eg. 百科的数据，网页中的数据等。

包装器是一个能够将数据从HTML网页中抽取出来,并且将它们还原为结构化的数据的软件程序。网页数据输入到包装器中，通过包装器的处理，输出为我们需要的信息。

2.1.3 非结构化数据处理

对于非结构化的文本数据，我们抽取的知识包括实体、关系、属性。

实体抽取
也称为命名实体识别，此处的实体包括概念，人物，组织，地名，时间等等。
关系抽取
实体和实体之间的关系，也是文本中的重要知识，需要采用一定的技术手段将关系信息提取出来。
属性抽取
也就是实体的属性信息，和关系比较类似，关系反映实体的外部联系，属性体现实体的内部特征。

2.2 知识融合

知识融合，就是将多个知识库中的知识进行整合，形成一个知识库的过程，在获得新知识之后，需要对其进行整合，以消除矛盾和歧义，比如某些实体可能有多种表达，某个特定称谓也许对应于多个不同的实体等；形成高质量的知识库。

知识融合的目的就是将不同知识库对实体的描述进行整合，从而获得实体的完整描述。主要包括：实体对齐，也包括关系对齐，属性对齐，可以通过相似度计算，聚合，聚类等技术来实现。

2.3 数据模型构建

知识图谱的数据=数据模型+具体数据
数据模型: 知识图谱的数据组织框架

2.4 知识推理

对于经过融合的新知识，进一步挖掘隐含的知识。
知识推理，根据已有的数据模型和数据，依据推理规则，获取新的知识或者结论，新的知识或结论应该是满足语义的。

eg. 比如实体的分类包含关系，一个电脑椅是椅子，椅子是家具，可以说，一个电脑椅是家具。常识规则的推理，一个男人的孩子是A，一个女人的孩子是A，可以知道，这个男人和女人是配偶。

2.5 质量评估

对最后的结果数据进行评估，将合格的数据放入知识图谱中。

eg. 对于公共领域的知识图谱，知识的获取采用了众包的方法，对于同一个知识点，可能会有很多人来完成，如果这个知识点只有一个答案，可以采用的一种策略是，将多人的标注结果进行比较，取投票多的结果作为最终的结果。

【参考】

[1] 知识图谱入门 (一) 知识图谱与语义技术概览, Pelhans, csdn

Original: https://blog.csdn.net/thefist11cc/article/details/113779990
Author: thefist11
Title: 知识图谱 (1)基本概念

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558492/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

12月编程语言排行榜公布啦~

2022年迎来了最后一个月，我们可以看到，在这一年中编程语言起起伏伏，有的语言始终炙手可热，而有的语言却逐渐”没落”…… 日前，全…

人工智能 2023年7月29日
0046
LeetCode 409. Longest Palindrome

Given a string s which consists of lowercase or uppercase letters, return the length of th…

人工智能 2023年6月28日
0063
conda 环境

准备工作：配置 conda 镜像默认的 conda 源下载速度比较慢，需要先将 conda 源设置为国内镜像 添加 Anaconda …

人工智能 2023年7月18日
0047
2021 CCF大数据与计算智能大赛个贷违约预测top 73 解决方案

目录一、概述二、解题过程 * 2.1 数据 2.2 构建基线 2.3 进阶思路一 2.4 进阶思路二 2.5 进阶思路三 2.6 融合 2.7 调优提分过程 2.8 其他工作 …

人工智能 2023年7月15日
0080
模型评估（误差平方和(SSE The sum of squares due to error)）

1 误差平方和(SSE The sum of squares due to error)： ¶ 举例:(下图中数据-0.2, 0.4, -0.8, 1.3, -0.7, 均为真实值…

人工智能 2023年5月31日
0079
微信小程序开发开启

小程序和普通网页开发的区别 1.运行环境不同小程序是运行在微信环境中，而网页是运行在浏览器环境中。 2.API不同由于运行环境不同，所以小程序中，无法调用DOM和BOM的API…

人工智能 2023年7月29日
0080
常用的UCI数据集

数据集信息：每条记录表示二维图形上的 100 个点。当按顺序（从 1 到 100）绘制为 Y 坐标时，这些点将创建一个山丘（地形中的”凸起”）或一个山谷（地…

人工智能 2023年6月30日
0069
机器学习中的隐变量/潜变量和隐藏空间/潜在空间

机器学习中的隐变量/潜变量和隐藏空间/潜在空间 * – 1.什么是隐变量？ – 1.什么是潜在空间（Latent Space）？ – 2.机器学…

人工智能 2023年7月27日
0066
Opencv编译及调用GPU版本

1、安装好cuda驱动可参考CUDA 环境搭建_ima_zhan的博客-CSDN博客_cuda环境搭建 2、下载opencv 3.11 的源代码和lib 在官网的release页…

人工智能 2023年6月19日
0097
强大的数据分析工具——Pandas操作、易错点、知识点三万字详解

一、 Pandas数据结构 1.Series2.DataFrame3.从DataFrame中查询出Series DataFrame: 二维数据、整个表格、多行多列 Series:一…

人工智能 2023年7月9日
00118
一文带你读懂DETR模型

论文地址： End-to-End Object Detection with Transformers Detr是Facebook提出来的一种目标检测结构，使用了一种基于trans…

人工智能 2023年6月17日
0099
Python学习笔记：使用PIL批量合成jpg+png图片，用于水印、合并图片，生成YOLO数据集+标注数据等等

【Python学习笔记】使用PIL，批量合成jpg+png图片，用于水印、合并图片，生成YOLO数据集+标注数据等等起因：在了解很多关于YOLOv5的相关内容，于是尝试着去训练…

人工智能 2023年6月18日
0084
pytorch深度学习环境配置（GPU3070）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 pytorch深度学习环境配置（GPU3070）前言一、Anaconda的安装二、CUDA安装 * 1.查看…

人工智能 2023年7月24日
00117
Pytorch自动混合精度(AMP)训练

相关问题：解决pytorch半精度amp训练nan问题 – 知乎 pytorch模型训练之fp16、apm、多GPU模型、梯度检查点（gradient checkpoi…

人工智能 2023年7月23日
0085
Bert不完全手册1. Bert推理太慢？模型蒸馏

模型蒸馏的目标主要用于模型的线上部署，解决Bert太大，推理太慢的问题。因此用一个小模型去逼近大模型的效果，实现的方式一般是Teacher-Stuent框架，先用大模型（Teach…

人工智能 2023年6月4日
0055
【三维几何学习】三角网格(Triangular Mesh)分类数据集

三角网格分类数据集引言一、SHREC’11 二、Cubes 三、ModelNet 四、MSB 五、3D-FUTURE 其它引言三角网格分类数据集相比图像要少很多…

人工智能 2023年7月3日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

知识图谱 (1)基本概念

大家都在看