部署农业知识图谱开源项目

2023年6月1日下午6:39 • 人工智能 • 阅读 96

项目是上海市《农业信息服务平台及农业大数据综合利用研究》子课题《上海农业农村大数据共享服务平台建设和应用》的研究成果。

该课题是由上海市农业委员会信息中心主持，以”致富农民、服务市民、提高行政管理效能”为目标，充分发挥大数据在农业农村发展中的重要功能和巨大潜力，重点建设上海市级农业农村大数据中心，促进信息资源的共建共享和创新应用。

华东师范大学数据科学与工程学院（以下简称华师大数据学院）作为课题主要参与单位以实现智慧农业为目标，探索农业大数据分析、挖掘和综合应用。华师大课题组在前期国家重点研发计划《大数据知识工程基础理论及其应用研究》研究基础上，在本项目中，基于碎片化农业大数据，构建面向智慧农业的知识图谱及其应用系统。

本文介绍整个项目的部署过程，记录和总结部署过程中存在的问题。

1. 环境准备

conda create -n kg python=3.6

conda activate kg

退出环境（可选）

conda deactivate

2. 安装依赖包

cd至项目根目录，有一个requirement.txt。requirement.txt文件里面记录了当前程序运行所需要的所有安装包和其版本号，作用是方便程序在其他机器上重新构建项目安装所有依赖。

打开requirement.txt文件可以看到里面需要安装的包：

Cython>=0.28.5
Django>=1.11.7
thulac>=0.1.2
py2neo4.1.0
pyfasttext0.4.5
pinyin>=0.4.0
pymongo>=3.6.1

requirement.txt的使用方式如下所示，即可自动下载requirement 中的安装包。

pip install -r requirement.txt

但需要注意的是我在安装过程中发现使用上述方式安装pyfasttext 安装失败。

参考这篇文章：https://pypi.org/project/pyfasttext/
首先直接安装cysignals和pyfasttext.

pip install cysignals
pip install pyfasttext

然后修改requirement.txt ，删除掉已经安装的pyfasttext. 再安装安装命令

pip install -r requirement.txt

3. 安装Jdk1.8

下载 Java
Java 8 下载地址：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

解压
tar -xzvf jdk-8u131-linux-x64.tar.gz

配置环境变量
这里通过修改/etc/project文件来配置环境变量

vim /etc/project

在文件末尾添加如下信息

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_131
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

执行以下命令，使之生效

source /etc/profile

检查 Java 版本

java -version

4. 安装neo4j

下载
从官网下载neo4j 的3.5.2版本，下载地址为neo4j社区版
注意： neo4j 4.1版本要求jdk11 ，neo4j 3.5版本要求jdk8。所以neo4j 选择3.5的版本。

tar zxvf neo4j-community-3.5.22-unix.tar.gz

修改目录

mv neo4j-community-3.5.22 neo4j

配置环境变量

vi /etc/profile

添加：

export NEO4J_HOME=/opt/neo4j
export PATH=$PATH:$NEO4J_HOME/bin

执行以下命令，使之生效

source /etc/profile

修改配置文件

vi /etc/security/limits.conf

neo4j soft nofile 40000
neo4j hard nofile 40000

vi /opt/neo4j/conf/

设置远程访问

dbms.connectors.default_listen_address=0.0.0.0

设置数据库名称

dbms.active_database=agriculture_kg.db

启动服务

neo4j start

查看状态

neo4j status

停止服务

neo4j stop

导入数据（这部分内容和Github中Readme文件一样）

将hudong_pedia.csv导入neo4j：开启neo4j，进入neo4j控制台。将hudong_pedia.csv放入neo4j安装目录下的/import目录。在控制台依次输入：

// &#x5C06;hudong_pedia.csv &#x5BFC;&#x5165;
LOAD CSV WITH HEADERS  FROM "file:///hudong_pedia.csv" AS line
CREATE (p:HudongItem{title:line.title,image:line.image,detail:line.detail,url:line.url,openTypeList:line.openTypeList,baseInfoKeyList:line.baseInfoKeyList,baseInfoValueList:line.baseInfoValueList})

// &#x65B0;&#x589E;&#x4E86;hudong_pedia2.csv
LOAD CSV WITH HEADERS  FROM "file:///hudong_pedia2.csv" AS line
CREATE (p:HudongItem{title:line.title,image:line.image,detail:line.detail,url:line.url,openTypeList:line.openTypeList,baseInfoKeyList:line.baseInfoKeyList,baseInfoValueList:line.baseInfoValueList})

// &#x521B;&#x5EFA;&#x7D22;&#x5F15;
CREATE CONSTRAINT ON (c:HudongItem)
ASSERT c.title IS UNIQUE

以上两步的意思是，将hudong_pedia.csv导入neo4j作为结点，然后对titile属性添加UNIQUE（唯一约束/索引）

（如果导入的时候出现neo4j jvm内存溢出，可以在导入前，先把neo4j下的conf/neo4j.conf中的dbms.memory.heap.initial_size 和dbms.memory.heap.max_size调大点。导入完成后再把值改回去）

进入/wikidataSpider/wikidataProcessing中，将new_node.csv,wikidata_relation.csv,wikidata_relation2.csv三个文件放入neo4j的import文件夹中（运行relationDataProcessing.py可以得到这3个文件），然后分别运行

// &#x5BFC;&#x5165;&#x65B0;&#x7684;&#x8282;&#x70B9;
LOAD CSV WITH HEADERS FROM "file:///new_node.csv" AS line
CREATE (:NewNode { title: line.title })

//&#x6DFB;&#x52A0;&#x7D22;&#x5F15;
CREATE CONSTRAINT ON (c:NewNode)
ASSERT c.title IS UNIQUE

//&#x5BFC;&#x5165;hudongItem&#x548C;&#x65B0;&#x52A0;&#x5165;&#x8282;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x5173;&#x7CFB;
LOAD CSV  WITH HEADERS FROM "file:///wikidata_relation2.csv" AS line
MATCH (entity1:HudongItem{title:line.HudongItem}) , (entity2:NewNode{title:line.NewNode})
CREATE (entity1)-[:RELATION { type: line.relation }]->(entity2)

LOAD CSV  WITH HEADERS FROM "file:///wikidata_relation.csv" AS line
MATCH (entity1:HudongItem{title:line.HudongItem1}) , (entity2:HudongItem{title:line.HudongItem2})
CREATE (entity1)-[:RELATION { type: line.relation }]->(entity2)

导入实体属性(数据来源: 互动百科)

将attributes.csv放到neo4j的import目录下，然后执行

LOAD CSV WITH HEADERS FROM "file:///attributes.csv" AS line
MATCH (entity1:HudongItem{title:line.Entity}), (entity2:HudongItem{title:line.Attribute})
CREATE (entity1)-[:RELATION { type: line.AttributeName }]->(entity2);

LOAD CSV WITH HEADERS FROM "file:///attributes.csv" AS line
MATCH (entity1:HudongItem{title:line.Entity}), (entity2:NewNode{title:line.Attribute})
CREATE (entity1)-[:RELATION { type: line.AttributeName }]->(entity2);

LOAD CSV WITH HEADERS FROM "file:///attributes.csv" AS line
MATCH (entity1:NewNode{title:line.Entity}), (entity2:NewNode{title:line.Attribute})
CREATE (entity1)-[:RELATION { type: line.AttributeName }]->(entity2);

LOAD CSV WITH HEADERS FROM "file:///attributes.csv" AS line
MATCH (entity1:NewNode{title:line.Entity}), (entity2:HudongItem{title:line.Attribute})
CREATE (entity1)-[:RELATION { type: line.AttributeName }]->(entity2)

//我们建索引的时候带了label，因此只有使用label时才会使用索引，这里我们的实体有两个label，所以一共做2*2=4次。当然，可以建立全局索引，即对于不同的label使用同一个索引

导入气候名称:

将wikidataSpider/weatherData/static_weather_list.csv放在指定的位置(import文件夹下)

//&#x5BFC;&#x5165;&#x8282;&#x70B9;
LOAD CSV WITH HEADERS FROM "file:///static_weather_list.csv" AS line
MERGE (:Weather { title: line.title })

//&#x6DFB;&#x52A0;&#x7D22;&#x5F15;
CREATE CONSTRAINT ON (c:Weather)
ASSERT c.title IS UNIQUE

导入气候与植物的关系


&#x5C06;wikidataSpider/weatherData/weather_plant.csv&#x653E;&#x5728;&#x6307;&#x5B9A;&#x7684;&#x4F4D;&#x7F6E;(import&#x6587;&#x4EF6;&#x5939;&#x4E0B;)
//&#x5BFC;&#x5165;hudongItem&#x548C;&#x65B0;&#x52A0;&#x5165;&#x8282;&#x70B9;&#x4E4B;&#x95F4;&#x7684;&#x5173;&#x7CFB;
LOAD CSV  WITH HEADERS FROM "file:///weather_plant.csv" AS line
MATCH (entity1:Weather{title:line.Weather}) , (entity2:HudongItem{title:line.Plant})
CREATE (entity1)-[:Weather2Plant { type: line.relation }]->(entity2)
&#x5BFC;&#x5165;&#x57CE;&#x5E02;&#x7684;&#x6C14;&#x5019;

&#x5C06;city_weather.csv&#x653E;&#x5728;&#x6307;&#x5B9A;&#x7684;&#x4F4D;&#x7F6E;(import &#x6587;&#x4EF6;&#x5939;&#x4E0B;)
(&#x8FD9;&#x6B65;&#x5927;&#x7EA6;&#x9700;&#x8981;15&#x5206;&#x949F;&#x5DE6;&#x53F3;)
//&#x5BFC;&#x5165;&#x57CE;&#x5E02;&#x5BF9;&#x5E94;&#x7684;&#x6C14;&#x5019;
LOAD CSV WITH HEADERS FROM "file:///city_weather.csv" AS line
MATCH (city{title:line.city}) , (weather{title:line.weather})
CREATE (city)-[:CityWeather { type: line.relation }]->(weather)

以上步骤是导入爬取到的关系

2.下载词向量模型：（如果只是为了运行项目，步骤2可以不做，预测结果已经离线处理好了）

http://s3-us-west-1.amazonaws.com/fasttext-vectors/wiki.zh.zip
将wiki.zh.bin放入 KNN_predict 目录。

3.修改Neo4j用户

进入demo/Model/neo_models.py,修改第9行的neo4j账号密码，改成你自己的

4.启动服务

进入demo目录，然后运行脚本：

sudo sh django_server_start.sh

这样就成功的启动了django。我们进入8000端口主页面，输入文本，即可看到以下命名实体和分词的结果（确保django和neo4j都处于开启状态）

Original: https://blog.csdn.net/u010414589/article/details/109090034
Author: 行路南
Title: 部署农业知识图谱开源项目

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558064/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【学习day1】图像分类数据集+softmax回归

主要来源：李沐老师的pytorch 动手学习深度学习（鞠躬感谢）记录每日所学，欢迎讨论目录一. 图像分类数据集 * 1. 读取数据集 2. 读取小批量 3. 整合所有组件二….

人工智能 2023年6月17日
00110
机器学习 —— 神经网络（matlab）

目录一、介绍二、实验数学原理三、实验算法和实验步骤四、实例分析一、介绍神经网络是一种运算模型，由大量的节点（或称”神经元”，或”单元…

人工智能 2023年6月12日
0092
改进YOLOv7系列：首发结合最新Centralized Feature Pyramid集中特征金字塔，通过COCO数据集验证强势涨点

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月25日
0071
Tableau日期处理10个技巧

作者：Janie 公众号《溜溜笔记说》，纯干货分享前言：在工作中使用Tableau的时候总会遇到各种各样的日期问题，比如需要默认本周、上周、本月MTD，上月MTD，过去x天等，…

人工智能 2023年7月16日
0067
【预训练语言模型】KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language Representation

【预训练语言模型】KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language Represen…

人工智能 2023年6月1日
0094
无人驾驶-控制-阿克曼模型

阿克曼模型推导一、序论 1.1 研究目的运动学是从几何学的角度研究物体的运动规律，包括物体在空间的位置、速度等随时间而产生的变化，因此，车辆运动学模型应该能反映车辆位置、速度、…

人工智能 2023年6月1日
00196
OpenJudge NOI 2.1 2723:因子问题

【题目链接】 OpenJudge NOI 2.1 2723:因子问题【题目考点】 1. 枚举 2. 因数如果n是a的倍数，那么称a是n的因数或因子。判断方法： n % a ==…

人工智能 2023年6月26日
00112
pandas读取csv相对路径_解决pandas使用read_csv()读取文件遇到的问题

如下：数据文件：上海机场 (sh600009) 24.11 3.58 东风汽车 (sh600006) 74.25 1.74 中国国贸 (sh600007) 26.38 2.66…

人工智能 2023年7月8日
0070
错误率、精度、查准率、召回率和F1得分

① 错误率与精度错误率和精度是分类问题中常用的性能度量指标，既适用于二分类任务，也适用于多分类任务. 错误率（error rate）：指分类错误的样本占样本总数的比例，即（分…

人工智能 2023年7月17日
0070
Python使用plot()函数画图进阶使用

目录使用介绍 plot()函数进阶使用（1）全局信息代码（2）绘图代码（1）画布设置（2）函数传入参数设置（3）函数内部代码解读（4）函数调用 (5)plt.tigh…

人工智能 2023年7月14日
0062
pytorch-textclassification是一个专注于中文文本分类（多类分类、多标签分类）的轻量级自然语言处理工具包，基于pytorch和transformers，包含各种实验

pytorch-textclassification是一个以pytorch和transformers为基础，专注于文本分类的轻量级自然语言处理工具包。支持中文长文本、短文本的多类分…

人工智能 2023年7月2日
0090
知识图谱从入门到应用——知识图谱的存储与查询：基于原生图数据库的知识图谱存储

分类目录：《知识图谱从入门到应用》总目录相关文章：· 知识图谱的存储与查询：基于关系数据库的知识图谱存储· 知识图谱的存储与查询：基于原生图数据库的知识图谱存储关系数据库的局限性…

人工智能 2023年6月1日
0079
从0到1构建一个基于知识图谱的智能问答系统

目录一、前言二、知识图谱 * 2.1 数据入库 – 2.1.1 Nebula Graph搭建 2.1.2数据导入三、后端 * 3.1 搭建Flask框架，处理ht…

人工智能 2023年6月24日
0088
ResNet+ FPN网络结构

1.ResNet 论文地址：ResNetResNet在PyTorch的官方代码中共有5种不同深度的结构分别为18、34、50、101、152，和论文的完全一致。如下图所示，下图是论…

人工智能 2023年5月28日
0097
目标检测RCNN系列的候选区选择算法——selective search（原理+Python实现）

原论文：《Selective Search for Object Recognition》关键字：分层分组算法、初始化区域集、相似度计算keywords: Hierarchical…

人工智能 2023年7月10日
0074
python取对数及作对数差在绘制散点图中的作用

文章目录前言一、diff()运算二、三种情况下的散点图 * 1.取数据 2.绘制散点图总结前言问题背景：在做两变量散点图分析其相关性时，在某本书上看到了如下操作： tr…

人工智能 2023年6月19日
0050

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31