图书知识图谱的设计与实现

2023年6月1日上午9:51 • 人工智能 • 阅读 56

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、知识图谱是什么？
二、图书知识图谱问答系统实现的两大主要模块
*
1.知识图谱构建模块
2.基于模板方法的问答模块
三、碰到的小问题
总结

前言

知识图谱，最早起源于Google Knowledge Graph，从最开始的Google搜索，到现在的聊天机器人、推荐系统、智能医疗、大数据风控、证券投资，都有知识图谱的身影。最近导师安排我复现一篇基于知识图谱和NLP的图书问答系统，以下浅浅的说一下这几天所学的内容和碰到的问题。

一、知识图谱是什么？

知识图谱是由 实体节点和 关系边组成的图的形式，这种图的形式可以将现实中不同类型的事物连接在一起。知识图谱的实体(entity)是节点，边(edge)是两个节点中间的有向连线，代表着实体之间的关系(relation)。知识图谱的基本组成单位是三元组，使用

; 二、图书知识图谱问答系统实现的两大主要模块

1.知识图谱构建模块

构建图书知识图谱，我们主要需要考虑三个方面， 数据获取， 数据处理，以及 数据存储。

最初的想法是去各大图书网站上，通过 爬虫手段爬取相关数据。因为从图书网站爬取获得的数据中包含一些非格式化、杂乱的数据。所以需要对数据获取部分得到的初始数据进行 数据清洗，使其变成格式化数据。并且对获取的这些数据进行分析和设计，抽取实体、关系和属性的知识三元组。最后用 图数据库Neo4j进行存储。
由于笔者才疏学浅，爬虫技术和数据分析和清洗等技术是另外一门手艺，这里我就暂时不考虑这两个方面，而是直接从相关渠道直接下载一些处理好的数据集，并将其导如Neo4j中。

上图是Neo4j的界面。由于我只找到了电影方面的相关数据，但是为了体验一下强大的Neo4j的功能，就将电影数据导入里面玩了玩。至于后续图书数据的问题，要是最后还没找到的话，笔者就打算自己人工生产百来个图书信息。

; 2.基于模板方法的问答模块

基于模板方法的问答模块的实现，也需要考虑三个方面，分别是 实体识别、 文本分类和 答案获取。具体框架如下：

（1）实体识别模块：这个模块是对用户的问句进行实体识别操作，采用Aho-Corasick自动机算法对用户输入的问句匹配图书实体词典中的实体词，图书实体词典即构建知识图谱时数据存储模块导出的图书实体的txt文件，通过实体识别操作即可从用户的问句中获得相关图书实体
（2）文本分类模块：这个模块对用户的问句进行文本分类，也就是对用户输入的问题进行意图识别，即获取用户是要获得某本书的作者，还是某本书的出版日期，或者是某作者写的书等意图。本模块采用可以进行文本分类操作的深度学习模型，通过标注后的数据进行训练，使得模型能够获得意图识别功能。系统从用户问句中获得意图后，将识别到的意图转化为图数据库中存在的关系类型。
（3）答案获取模块：将用户问句从实体识别模块得到的实体，和意图识别模块得到的关系封装成字典，将字典转化为Cypher语句到Neo4j数据库中进行查询，得到实体的名字属性加入到经过提前设置好的回答模板中，从而获得了用户所需的答案。

该问答模块的设计，笔者目前只是浅浅地学习了一下上面的设计流程，还没有进行实际操作。

三、碰到的小问题

在写代码的过程中，因为要导入一个包pandas，由于解释器python3.7没有这个包，所以我就尝试在这里面搜索并下载导入

但是接下来它提示error

于是我就在终端控制台上尝试用镜像网站导入这个包，最后还是失败了

最后一行提示让我更新pip，我照做了，但也没能成功更新
图书知识图谱的设计与实现

我在网上也看到过类似的问题，于是我便按照他们的解决方案操作，令人悲哀的是，依旧失败了，所以我很崩溃，希望有友友们能帮我解决一下。

; 总结

以上就是这几天所学习的内容，经过这几天的学习，对知识图谱也有一定的认识，并且也了解了一下Neo4j的一些操作。

Original: https://blog.csdn.net/qq_56550595/article/details/125529906
Author: 今天又干了些什么呢
Title: 图书知识图谱的设计与实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556135/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ubuntu20.04安装rocm教程，AMD深度学习，6800xt配置pytorch、CUDA（已更新）本地安装torch

官方文档对应torch下载地址 ROCm安装配置踩坑遇到的问题安装ubuntu系统更新内核，但是在win和Ubuntu双系统的前提下（可能）导致内核更新不成功,我安装成功的内…

人工智能 2023年6月16日
00440
shape_based_matching代码解读0422

写作本系列文章旨在就个人学习该论文及其开源项目做一个学习分享和交流。原论文篇名：Gradient Response Maps for Real-TimeDetection of …

人工智能 2023年7月19日
0059
基于OpenCV的车牌识别与分割

基于OpenCV的车牌识别与分割车牌识别的整个流程分为车牌位置查找, 车牌分割, 字符分割三部分, 车牌位置查找主要基于色彩空间查找的方法, 车牌分割主要基于位置查找之后的车牌二…

人工智能 2023年6月21日
0062
Python 基础教程 —— Pandas 库常用方法实例说明

目录 1. pandas.Series（data=None, index=None, dtype=None, name=None, copy=False, fastpath=Fal…

人工智能 2023年7月8日
0063
左手Python 右手R —— 前N阶乘求和、金字塔数求和

左手Python 右手R —— 前N阶乘求和、金字塔数求和前言 1、前N阶乘求和 * 1.1 图解问题 1.2 算法流程 1.3 代码实现 1.3.1 python代码实现 &#…

人工智能 2023年7月17日
0069
【深度学习基础】学习率(learning rate)的理解与分类

文章目录 1. 训练与学习率的关系 2. 学习率的衰减策略 * （1）分段常数衰减（2）指数衰减（3）自然指数衰减（4）多项式衰减（5）余弦衰减（6）Lambda学习率 …

人工智能 2023年6月17日
0089
目标检测算法（传统&基于深度学习的）

目标检测算法最近在学目标检测各类算法，主要分为传统的目标检测方法和基于深度学习的目标检测算法，这里记录了一些基本的算法介绍。下图是目标检测算法的发展历程 ; 传统目标检测方法分…

人工智能 2023年6月17日
0084
JVM-GC

JVM组成 ; 栈指的是java虚拟机栈，是一块线程私有的内存空间，每个线程包含一个栈区，栈中只保存基本数据类型的数据和自定义对象的引用，堆 java堆是java虚拟机所管理的…

人工智能 2023年6月28日
0059
YOLOX改进之模型轻量化（Lite）

文章内容：给YOLOv5-Lite系列轻量级模型换上YOLOX头部环境：pytorch1.7+cuda11.0注意：YOLOv5版本为5.0，可以匹配YOLOX的主干网络与neck…

人工智能 2023年6月16日
0066
数据可视化之美 — 以Matlab、Python为工具

在我们科研、工作中，将数据完美展现出来尤为重要。数据可视化是以数据为视角，探索世界。我们真正想要的是 — 数据视觉，以数据为工具，以可视化为手段，目的是描述真实，探索世界。下面介绍…

人工智能 2023年7月5日
0081
[附源码]计算机毕业设计JAVAjsp智慧农产品朔源系统

[附源码]计算机毕业设计JAVAjsp智慧农产品朔源系统项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX （Webstorm也行…

人工智能 2023年6月28日
0076
手把手系列|怎么做联合建模？看这篇文章就够了

序言：在信贷风控场景中，联合建模指的是放贷机构和外部数据厂商合作的建模项目，合作的方式为放贷机构提供有风险表现的样本给到数据厂商，去匹配特征数据来开发模型，然后接入模型来做风险策…

人工智能 2023年7月15日
0058
Maven工程开发

目录一、Maven工程开发_构建Maven工程二、Maven工程开发_pom文件配置三、Maven工程开发_编写代码四、Maven工程开发_依赖范围一、 Maven工程开…

人工智能 2023年7月31日
0068
复现开源论文代码总结

复现开源论文代码总结 1. 找到开源论文的代码 2. 阅读README.md说明文档 3. 代码下载与解压 4. 配置环境、下载数据集与预训练权重 5. 运行代码，排错参考随着…

人工智能 2023年7月4日
0050
Python数据分析项目实例5：分析某餐饮企业的订单详情表数据（基于matplotlib的python数据可视化分析）

目录一、提前准备 1、python第三方库的准备 2、SQL文件的准备二、项目背景三、数据预处理 1、导入相关库 2、构建通道 3、文件读取与合并 4、相关信息的预处理 5、…

人工智能 2023年7月15日
0070
【论文考古】量化SGD Deep Learning with Limited Numerical Precision

使用无偏的随机取整的16比特定点数来训练神经网络，得到了与浮点数训练几乎一样的性能 S. Gupta, A. Agrawal, K. Gopalakrishnan, and P. …

人工智能 2023年6月4日
0075

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

图书知识图谱的设计与实现

文章目录

1.知识图谱构建模块

; 2.基于模板方法的问答模块

大家都在看