四、py2neo 使用及构建图谱（知识图谱构建射雕人物关系）

2023年6月1日下午2:14 • 人工智能 • 阅读 102

Neo4j 为多种语言提供了 API 接口，如 java， python， C#， RUBY， .NET等。本文首先介绍用 python 操作 Neo4j。

首先安装好py2neo库

sudo pip3 install py2neo

1. 连接数据库
from py2neo import Graph
连接本地的 Neo4j 数据库，地址为 127.0.0.1，http 端口默认为 7474，用户名和密码分别为 neo4j 与 123
graph = Graph(host='127.0.0.1', http_port=7474, user='neo4j', password='123')

2. 创建节点
from py2neo import Node
创建角色节点 郭靖，拥有属性 姓名-郭靖，性别-男
guojing = Node('角色',name='郭靖',sex='男')

3. 操作属性
获取key对应的属性
guojing['name']
设置 key 对应属性的value，如果key不存在就创建
huangrong['born'] = '桃花岛'
删除某个属性
del huangrong['born']
返回节点中 property 的个数
len(huangrong)

此时的节点已经创建在本地，但还没有上传到 Neo4j 数据库中，因此在 Neo4j 客户端中是没有任何内容的，所以接下来使用 Graph 中的 create 方法来上传数据。
graph.create(guojing)

在这里，如果重复 create 同一个节点，如

&#x53CD;&#x590D;&#x6267;&#x884C;&#x6B64;&#x547D;&#x4EE4;&#x6765;&#x521B;&#x5EFA;&#x90ED;&#x9756;&#x8282;&#x70B9;
graph.create(guojing)

&#x91CD;&#x65B0; guojing &#x53D8;&#x91CF;&#x8D4B;&#x503C;
guojing = Node('&#x89D2;&#x8272;',name='&#x90ED;&#x9756;',sex='&#x7537;')
guojing

实际上在 Neo4j 数据库中并不会重复创建，因为在上传 guojing 节点时，变量的 <id></id> 属性已经固定，所以不会重复。如果重新定义一个 guojing 节点。节点前的 <id></id> 属性被抹去，此时在上传，数据库中就会存在两个相同节点了，若要避免这种情况，就需要用到 Graph 中的 merge 方法了。

关系的操作和节点操作很类似：

4. 创建关系
from py2neo import Relationship
创建郭靖与黄蓉的配偶关系
spouse1 = Relationship(guojing,'配偶',huangrong)
创建黄蓉与郭靖的配偶关系
spouse2 = Relationship(huangrong,'配偶',guojing)
创建郭靖与射雕英雄传的所在作品关系
inbook1 = Relationship(guojing,'所在作品',shediao)
创建黄蓉与射雕英雄传的所在作品关系
inbook2 = Relationship(huangrong,'所在作品',shediao)
打印结果
spouse1,spouse2,inbook1,inbook2

设置 key 对应属性的 value
inbook1['role'] = '男主角'

删除某个属性
del inbook1['role']

创建黄蓉与射雕英雄传的所在作品关系
graph.create(inbook2)

5. 查找
from py2neo import NodeMatcher
初始化一个 matcher 实例
matcher = NodeMatcher(graph)
用 match 方法查找 角色中name为郭靖的节点，返回一个 NodeMatch 对象
result = matcher.match("角色", name="郭靖")
first 方法返回查询结果的第一个
result.first()
通过 list 来把所有结果显示出来
list(result)

Graph 同时提供 run 方法来直接执行 Cypher 语句。

cypher 语句，对已存在的郭靖节点，创建节点和关系 (郭靖)-[父]->(郭啸天)
query = "match (n) where n.name = '郭靖' create (n)-[:父]->(:角色{name:'郭啸天'})"
执行 cypher 语句
graph.run(query)

run 方法返回的是游标 cursors，cursors 必须通过遍历来展示结果
cypher 语句，查询并返回所有的节点
query = "match (n) return n"
执行 cypher 语句，获得返回结果
cursors = graph.run(query)
通过遍历的方式取出所有结果
for i in cursors:
    print(i)

以上讲述了 Neo4j 数据库的 python 驱动 py2neo 的基本使用方法，在实际应用中，由于 python 胶水语言的特性， py2neo 可以搭配其他库方便地对知识图谱进行创建。比如在数据集中存在重复数据的情况，可以先用 python 进行一遍去重，再提交，比用 Cypher 语言去重速度更快。然而需要向数据库中写入大量数据时，用 CREATE 一条一条创建是非常低效的，因此，下面将介绍如何批量导入数据。

常见导入方法总结如下表：

CREATE 语句LOAD CSV 语句Batch InserterBatch ImportNeo4j-admin import适用场景1 ~ 1 w nodes1 w ~ 10 w nodes千万以上 nodes千万以上 nodes千万以上 nodes速度1000 nodes/s5000 nodes/s数万 nodes/s数万 nodes/s数万 nodes/s优点使用方便，可实时插入使用方便，可加载本地和远程 CSV；可实时插入速度相比于前两个有数量级的提升基于 Batch Inserter，可直接运行编译好的 jar 包，可以在已存在的数据库中导入数据比 Batch Import 占用更少的资源缺点速度慢需要将数据转换成 CSV需要转成 CSV；只能在 JAVA 中使用；必须停止 Neo4j需转成 CSV；必须停止 Neo4j需要转成 CSV；必须停止 Neo4j；只能生成新的数据库，而不能在已存在的数据库中插入数据

这里重点介绍neo4j-admin import 构建，Neo4j 官方提供了 neo4j-admin import 来解决数据量非常大时导入的性能瓶颈。

参数设置如下：

–nodes 节点所在 CSV 文件
–relationships 关系所在 CSV 文件

nodes 节点所在 CSV 文件格式形式如下

第一列为 ID 号，在构建关系时必须用过 ID 号来对应关系，第二、三列为属性值，第四列为节点类型。

relationships 关系所在 CSV 文件格式形式如下

第一列表示起始节点的 ID 号，第二列表示截至节点的 ID 号，第三列为关系类型。

在使用 neo4j-admin import 时，需要先 sudo neo4j stop 停止 Neo4j 服务，同时删除旧的 graph.db 文件（通过 neo4j.conf 可以知道在 /var/lib/neo4j/data/databases 目录下）。

$ ./neo4j-admin import --nodes=../import/nodes.csv --relationships=../import/relationships.csv

Original: https://blog.csdn.net/harleyrecsys/article/details/125171085
Author: 推荐算法研究僧
Title: 四、py2neo 使用及构建图谱（知识图谱构建射雕人物关系）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557250/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Unity UI、图片(Sprite)的显示层级(遮挡关系)控制

UI之间如何控制互相的遮挡关系：一个方法是给每个UI都添加一个Canvas组件，选中 Override Sorting之后就可以通过调整Sort Order的数值来控制遮挡关系。…

人工智能 2023年7月31日
0053
[nlp] SQuAD 数据集介绍(Q+A+原文)

一、SQuAD 1.1 SQuAD 是由 Rajpurkar等人提出的一个抽取式QA数据集 [闭集]。该数据集包含 10 万个（问题，原文，答案）三元组，原文来自于 536 篇…

人工智能 2023年5月27日
0051
Loss上升，精度却也上升？

1、情况说明在训练中遇到了下图验证集损失先降后升，这是典型的过拟合，但是此时验证集精度却仍然在上升（直觉认为Loss上升变差应当精度下降变差），这种反直觉的现象引发了思考 ; 2…

人工智能 2023年7月27日
00193
基于sklearn随机森林算法对鸢尾花数据进行分类

随机森林定义随机森林（Random Forest，RF），顾名思义就是将多棵相互之间并无关联的决策树整合起来形成一个森林，再通过各棵树投票或取均值来产生最终结果的分类器。在介绍随…

人工智能 2023年6月16日
0078
2020年12月大学英语六级作文

1.第一套 2.第二套 3.第三套 why students should be encouraged to develop effective communication ski…

人工智能 2023年6月26日
0059
YOLO算法详解

目录前言 * YOLOv1 YOLOv2 YOLOv3 前言 YOLO官网：https://github.com/pjreddie/darknetYOLO及You Only Lo…

人工智能 2023年7月9日
00103
python dataframe删除某一列_Python进行数据处理之Pandas的drop函数

删除表中的某一行或者某一列更明智的方法是使用drop，它不改变原有的df中的数据，而是返回另一个dataframe来存放删除后的数据。本文出处主要来源于必备工具书《利用python…

人工智能 2023年7月8日
0063
Matlab 学习入门图像处理

一：常用指令 clc; 清屏,清楚命令窗口的内容，对变量没有影响； clear;清楚工作区间变量 clear all: 清楚工作区间的所有变量，函数，和mes文件； close ：…

人工智能 2023年6月17日
00101
pandas 数据整理（转置）

学习目标掌握melt函数整理数据的方法掌握stack、unstack的用法掌握wide_to_long函数的用法 1 melt整理数据加载美国收入与宗教信仰数据 impor…

人工智能 2023年7月8日
0085
MySQL的卸载与安装

MySQL的卸载与安装环境：Ubuntu20.04 MySQL版本： 5.7 注：Ubuntu 20.04 版本系统自带的 MySQL 版本是 8.0，本文给出 5.7 版本的安…

人工智能 2023年6月27日
0082
【Pandas】DataFrame数据的增删改

DataFrame数据的增删改 DataFrame增加数据 * 增加一行增加列 – 根据原有数据增加列 DataFrame修改数据 * 修改单个数据修改一列数据 D…

人工智能 2023年7月6日
0050
分类问题为什么用交叉熵损失不用 MSE 损失

本文说明以下问题 MSE 损失主要适用与回归问题，因为优化 MSE 等价于对高斯分布模型做极大似然估计，而简单回归中做服从高斯分布的假设是比较合理的交叉熵损失主要适用于多分类问题…

人工智能 2023年7月1日
00113
吴恩达深度学习deeplearning.ai——第一门课：神经网络与深度学习——第二节：神经网络基础（下）

向量化是非常基础的去除代码中for循环的技术，在深度学习安全领域、深度学习实践中，你会经常发现自己训练大数据集，因为深度学习算法处理大数据集效果很棒，所以你的代码运行速度非常重要，…

人工智能 2023年6月17日
0092
实战OpenPose项目3：pytorch 实现openpose(包括手和身体姿态估计)

目录简介快速入门下载训练好的模型运行演示简介 pytorch实施openpose包括身体和手姿态估计，并且pytorch模型直接从转换openpose caffemode…

人工智能 2023年7月21日
0095
【目标检测】mAP评价指标介绍

目标检测mAP概念详解 1 基础概念 * 1.1 IoU 1.2 Precision and Recall 1.3 PR Curve（PR曲线） 1.4 AP（average pr…

人工智能 2023年7月12日
0099
数据分析day5之pandas

数据合并之join join:默认情况下他是把行索引相同的数据合并到一起数据合并之merge merge:按照指定的列把数据按照一定的方式合并到一起分组和聚合在pandas …

人工智能 2023年7月6日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

四、py2neo 使用及构建图谱（知识图谱构建射雕人物关系）

大家都在看