医药领域知识图谱快速及医药问答项目（项目全过程）

2023年6月1日上午4:41 • 人工智能 • 阅读 77

该项目是中科院软件所刘焕勇老师在github上的开源项目，基于知识图谱的医药领域问答项目

Github项目地址：mirrors / liuhuanyong / qasystemonmedicalkg · GitCode

一、项目环境搭建

该部分要十分注意，由于版本升级的问题，一些用法及格式已经不兼容了。

python3.8

下载地址：Python Release Python 3.8.10 | Python.org 医药领域知识图谱快速及医药问答项目（项目全过程） https://www.python.org/downloads/release/python-3810/;

Neo4j数据库安装 (我用的是4.2.2版本 JDK是15)

这个博主写得好，贴下链接：(3条消息) neo4j数据库安装 – CSDN 医药领域知识图谱快速及医药问答项目（项目全过程） https://www.csdn.net/tags/NtzaQg5sNTk2My1ibG9n.html ;

MongoDB安装 (我用的是4.0)

这个博主写得好，贴下链接：(3条消息) MongoDB安装详细教程(爬坑之路)_Just Do Its的博客-CSDN博客_mongodb安装医药领域知识图谱快速及医药问答项目（项目全过程） https://blog.csdn.net/liu991029/article/details/114709588 ; 环境配置差不多了，如果项目运行失败，看看这些软件是否运行

项目运行时以下三个cmd窗口不要关闭！！！

运行neo4j数据库

在浏览器中输入 localhost:7474

开启mongodb服务

开启mongodb客户端，27017是默认端口

如果还有环境以及版本、语法格式这种问题，就不要问我了。

二、数据获取

在该项目prepare_data目录下

该目录下的一些代码写法已经过时，报错了请自行百度。

1. ，运行data_spider.py（保证mongodb服务是开启的）

该程序末尾添加这三行以调用

handler = CrimeSpider()
handler.inspect_crawl()
handler.spider_main()

运行结果：

2. 运行build_data.py

这里需要好好说说，在这个py文件里面，有一个神秘的first_name.txt，但是刘焕勇老师并没有在项目中给出。于是我在这里猜测它就是medical.json的前身，在刚刚运行data_spider.py之后，mongodb里面已经有东西了，所以我认为first_name.txt就是从data数据库中导出的文件。(这里需要格式转换，mongodb并不支持txt格式，需要另存为txt格式)

first_name.txt就是长这样：

函数调用

if __name__ == '__main__':
    handler = MedicalGraph()
    handler.modify_jc()
    handler.collect_medical()

运行build_data.py结束后，medical数据库中也有东西了，继续导出，

我们得到second_name.txt，这已经非常接近medical.json了

这里我也挖个坑（其实是我不会）

从second_name.txt到medical.json需要进一步操作，如果有哪位小伙伴知道怎么做，请在评论区告诉我。

三、搭建图数据库

1.运行build_medicalgraph.py , 这需要几个小时

四、智能问答

1.question_classifier.py

该文件中有一段写法报错，已改正

        # &#x52A0;&#x8F7D;&#x7279;&#x5F81;&#x8BCD;  &#x8FD9;&#x91CC;encoding&#x7528;&#x7684;&#x662F;&#x2018;utf-8&#x2019;&#x6A21;&#x5F0F;&#xFF0C;&#x4E0D;&#x52A0;&#x7684;&#x8BDD;&#xFF0C;&#x6211;&#x7684;pycharm&#x4F1A;&#x62A5;&#x9519;
        self.disease_wds = [i.strip() for i in open(self.disease_path, encoding='utf-8') if i.strip()]
        self.department_wds = [i.strip() for i in open(self.department_path, encoding='utf-8') if i.strip()]
        self.check_wds = [i.strip() for i in open(self.check_path, encoding='utf-8') if i.strip()]
        self.drug_wds = [i.strip() for i in open(self.drug_path, encoding='utf-8') if i.strip()]
        self.food_wds = [i.strip() for i in open(self.food_path, encoding='utf-8') if i.strip()]
        self.producer_wds = [i.strip() for i in open(self.producer_path, encoding='utf-8') if i.strip()]
        self.symptom_wds = [i.strip() for i in open(self.symptom_path, encoding='utf-8') if i.strip()]
        self.region_words = set(
            self.department_wds + self.disease_wds + self.check_wds + self.drug_wds + self.food_wds + self.producer_wds + self.symptom_wds)
        self.deny_words = [i.strip() for i in open(self.deny_path, encoding='utf-8') if i.strip()]

2.运行chatbot_graph.py

这里参考了fumuling/KGQA-Psychological-Counseling: 基于知识图谱的心理咨询智能问答系统 (github.com) 医药领域知识图谱快速及医药问答项目（项目全过程） https://github.com/fumuling/KGQA-Psychological-Counseling ;

运行 api.py,然后直接进入home.html

效果展示：

结语

最后再次感谢医药领域知识图谱快速及医药问答项目和基于知识图谱的心理咨询智能问答系统这两个项目的创作者。如果有什么遗漏或者错误的话，欢迎在评论区指正。

Original: https://blog.csdn.net/qq_52062182/article/details/124542279
Author: 奔跑的蜗牛2.0
Title: 医药领域知识图谱快速及医药问答项目（项目全过程）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/554805/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【OpenCV】红绿灯检测C++Demo实现

很久以来一直想实现红绿灯检测，今天它来了。文章目录 * – 原理 – 代码实现 – 打包程序为exe 原理 OpenCV好强，能够提取红绿灯的…

人工智能 2023年6月19日
0069
把盏言欢,款款而谈,ChatGPT结合钉钉机器人(outgoing回调)打造人工智能群聊/单聊场景,基于Python3.10

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0034
【统计学习方法】第四章朴素贝叶斯

模型定位：朴素贝叶斯属于分类模型、生成模型👉 GitHub地址基本概念条件概率：P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(A…

人工智能 2023年7月2日
0068
OpenCV4.5.5学习笔记（一）：环境配置Visual Studio2022+OpenCV4.5.5

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、OpenCV4.5.5下载二、OpenCV配置到VS2020 * 1.环境变量配置 2.VS…

人工智能 2023年7月19日
00131
深度学习-nlp系列（2）文本分类（Bert）pytorch

对于 Bert 来说，用于文本分类是最常见的，并且准确率也很高。本文将会对 bert 用于文本分类来做详细的介绍。预训练模型对于不同的数据，需要导入不同的预训练模型。预训练模…

人工智能 2023年5月30日
0056
（Note）Python osgeo&shapefile库的安装

shapefile anaconda：conda install pyshp pip：pip install pyshpe osgeo 进入Link：https://www.lfd…

人工智能 2023年7月4日
00323
【数据挖掘】2022年京东算法工程师笔试题（23届）

时间：90分钟2022年京东算法工程师笔试题（23届） 1、MySQL内部存储代码的优势服务器上执行还可以节省带宽和网络延迟代码重用。可以方便的统一业务规则，保证某些行为的一致…

人工智能 2023年6月19日
0086
分段处理_非比例风险的Cox回归模型_分段模型

转自个人微信公众号【Memo_Cleon】的统计学习笔记：非比例风险的Cox回归模型_分段模型。虽然风险比例假定在整个随访时间内不成立，但在一个较短的时间段内则可能是成立的，分段…

人工智能 2023年6月18日
0085
深度学习系列教程——Tensorflow下载与安装（懂的分享，才是真正的互联网人）

我们以 Windows 10 系统为例讲解如何安装 TensorFlow。这里我们介绍两种安装方式，一种是通过 pip 包管理器进行安装，另一种是通过 Anaconda 安装。使…

人工智能 2023年5月25日
0071
pycharm运行python程序环境配置

第一步：pycharm配置python运行环境： setting————–project interpreter 选择d…

人工智能 2023年7月29日
0066
pandas进行数据处理

pandas读取多列选择表格中的’w’、’z’列 data[[‘w’,’z’]] …

人工智能 2023年7月7日
0093
tensorRT踩坑日常之训练模型转ONNX转engine

tensorRT是用来干嘛的在这里就不多介绍了在使用tensorRT提速之前需要先训练模型在将训练好的模型转ONNX再转engine 一、将训练好的模型转ONNX这里就提供将tor…

人工智能 2023年6月24日
00648
R语言实战应用精讲50篇（二十五）-时空数据统计模型：确定性预测模型

本章的主要目的是详细讨论时空统计建模的三个目标：在给定时空数据的空间新位置进行预测用时空数据进行参数推断预测未来的新值我们还强调了在我们的预测、参数估计和预测中量化不确定…

人工智能 2023年6月17日
0064
DenseNet学习笔记（核心与resnet进行对比）：

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月13日
0046
AI首席架构师6-AICA-从数据到知识-百度知识图谱技术及应用

介绍目录 ; 百度知识图谱总体介绍人工智能技术布局让机器像人类一样理解，有一定的地理、历史等知识知识图谱基本结构行业应用知识图谱发展历程技术视图构建技术信息抽取技术进化统一的…

人工智能 2023年6月10日
0059
ModuleNotFoundError: No module named ‘tensorflow.contrib‘

在用pycharm运行prnet神经网络时，出现了这个问题，经查资料，是tensorflow版本的问题，这里建议安装 tensorflow1.5.0版本；（tensorflow1….

人工智能 2023年5月23日
0093

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30