医疗问答机器人项目部署

2023年5月24日下午7:37 • 人工智能 • 阅读 62

医疗问答机器人项目部署

文章目录

医疗问答机器人项目部署
1. 拉取TensorFlow镜像
2. 配置系统环境
*
2.1 更换软件源
2.2 下载vim
2.3 解决vim中文乱码问题
2.4 安装Neo4J图数据库
2.5 安装网络工具包
3. 运行项目
*
3.1 拷贝项目到容器中
3.2 安装项目所需的工具包
3.3 导入数据
3.4 打开实体抽取服务
3.5 打开意图识别服务
3.6 打开问答助手服务
3.7 效果展示
4. 搭建项目镜像
*
4.1 Docker commit搭建
4.2 Dockerfile搭建
5. 发布项目镜像

这是去年8月份做的项目，当时我参加了南航16院卓工班的实训，是做了一个智能医疗系统，其中包含了这个医疗问答助手功能。由于当时受限于时间和知识水平，当时的问答助手的功能较为简单，可以理解为是基于规则的问答系统，不能算真正意义上的智能。故在今年年初的时候再完善一下这个项目，使用NLP领域的一些算法使其更符合实际使用。

拉取TensorFlow镜像

从Docker Hub拉取TensorFlow的镜像，在该镜像上进行下面的操作。


$ docker pull tensorflow/tensorflow:1.14.0-py3

$ docker run -dit --name diagnosis -p 5002:5002 -p 7474:7474 -p 7473:7473 -p 7687:7687 -p 60061:60061 -p 60062:60062 tensorflow/tensorflow:1.14.0-py3

$ docker exec -it diagnosis bash

5002端口是项目端口；7473、7474和7687三个端口是neo4j的端口；60061和60062是另外两个服务的端口。

查看容器tensorflow的版本和gpu是否可用，进入python终端输入下面的指令，可以看到使用的tensorflow版本是 1.14.0。

>>> import tensorflow as tf
>>> tf.__version__
'1.14.0'
>>>tf.test.is_gpu_available()
False

配置系统环境

查看Ubuntu版本，即 18.04.2版本。

root@322e47635519:/workspace/Diagnosis-Chatbot
Ubuntu 18.04.2 LTS \n \l

2.1 更换软件源

首先使用以下命令备份原始软件源。

[En]

Back up the original software source first, with the following command.

cp /etc/apt/sources.list /etc/apt/sources.list.bak

因为镜像没有安装vim，故只能通过 echo指令更改 /etc/apt/sources.list文件内容。

阿里源

echo "">/etc/apt/sources.list
echo "deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse">>/etc/apt/sources.list
echo "deb http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse">>/etc/apt/sources.list
echo "deb http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse">>/etc/apt/sources.list
echo "deb http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse">>/etc/apt/sources.list
echo "deb http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse">>/etc/apt/sources.list
echo "deb-src http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse">>/etc/apt/sources.list
echo "deb-src http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse">>/etc/apt/sources.list
echo "deb-src http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse">>/etc/apt/sources.list
echo "deb-src http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse">>/etc/apt/sources.list
echo "deb-src http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse">>/etc/apt/sources.list

更新软件源。

apt-get update
apt-get upgrade

在更换软件源时，我首先使用的是清华源，但是在下载vim时提示说不能下载vim相关的一些依赖。在网上搜索后应该是源的问题，后来我就更换为阿里源了。

2.2 下载vim

修改文件内容需要使用vim，所以要下载。

apt-get install vim -y

下载完成后可以通过下面的指令查看vim的版本。

vim --version

2.3 解决vim中文乱码问题

修改 /etc/vim/vimrc内容，在最后面添加下面的内容：

set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936
set termencoding=utf-8
set encoding=utf-8

设置完成后，文件中的中文即可正常显示。

[En]

After setting up, the Chinese in the file can be displayed normally.

2.4 安装Neo4J图数据库

详细步骤可以看我的另外一篇博客—在Linux系统下安装Neo4j图数据库。

2.5 安装网络工具包

apt-get install inetutils-ping
apt-get install net-tools

运行项目

3.1 拷贝项目到容器中

首先在容器中创建 workspace目录，将项目代码放入到该目录下。

root@322e47635519:/

将本机上的项目代码文件复制到容器的工作目录中。

[En]

Copy the project code file on this machine to the working directory of the container.

$ docker cp "本机上项目的路径" diagnosis:/workspace/

上面的指令实现的功能是，将项目拷贝到 diagnosis容器中的 /workspace/目录下。

3.2 安装项目所需的工具包

首先要升级pip，升级指令如下。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip

使用pip指令下载工具包， -i后面使用的清华源，最后是工具包的名称。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple packageName

我需要在这个容器中安装的包如下：

[En]

The packages I need to install in this container are as follows:


pip install -i https://pypi.tuna.tsinghua.edu.cn/simple py2neo==2021.2.3
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas==1.1.5
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tqdm==4.62.3

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy==1.19.5
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple flask==1.1.4
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple flask_cors==3.0.10
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-learn==0.24.1
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests==2.26.0

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyahocorasick==1.4.2
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent==1.5.0

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple bert4keras==0.10.8

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple huggingface_hub==0.0.6
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple hyperpyyaml==0.0.1
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple joblib==0.14.1
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pre-commit==2.3.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple sentencepiece==0.1.91
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple SoundFile==0.10.2
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch==1.8.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchaudio==0.8.0

在启动服务的时候报错了： OSError: sndfile library not found。报错原因是因为缺少 libsndfile，需要安装，安装指令如下。

$ apt-get install libsndfile1

3.3 导入数据

首先打开容器中的Neo4j服务。

neo4j start

在项目中有个 build_kg文件夹，进入到该文件夹中，执行 build_kg_utils.py程序即可将数据导入Neo4j数据库中。

$ python build_kg_utils.py

这个过程将需要几个小时。

[En]

The process will take several hours.

3.4 打开实体抽取服务

在项目根目录中的 knowledge_extraction\bilstm下存放着BiLSTM算法的代码，需要启动该服务。

$ python app.py

因为是使用别人写好的算法代码，在启动时提示版本不兼容的问题，原作者使用的是tensorflow1.0版本，在很多地方上写法不一致，故在此记录。

首先在 app.py中需要修改以下代码：

旧代码新代码config = tf.ConfigProto()config = tf.compat.v1.ConfigProto()sess = tf.Session(config=config)sess = tf.compat.v1.Session(config=config)graph = tf.get_default_graph()graph = tf.compat.v1.get_default_graph()

config = tf.ConfigProto() => config = tf.compat.v1.ConfigProto()
sess = tf.Session(config=config) => sess = tf.compat.v1.Session(config=config)
graph = tf.get_default_graph() => graph = tf.compat.v1.get_default_graph()

3.5 打开意图识别服务

在项目根目录中的 nlu\intent_recg_bert下存放着使用 Bert模型的意图识别算法的代码，需要启动该服务。

$ python app.py

因为是使用别人写好的算法代码，在启动时提示版本不兼容的问题，原作者使用的是tensorflow1.0版本，在很多地方上写法不一致，故在此记录。

首先在 app.py中需要修改以下代码：

config = tf.ConfigProto() => config = tf.compat.v1.ConfigProto()
sess = tf.Session(config=config) => sess = tf.compat.v1.Session(config=config)
graph = tf.get_default_graph() => graph = tf.compat.v1.get_default_graph()

3.6 打开问答助手服务

在 app.py中需要检查主机号和端口号，主机号要写成 0.0.0.0不然本机打不开项目，如果端口号要和创建容器时映射的端口一致（这里我设置了5002）。而且要关闭调试模式。

app.run(host='0.0.0.0', port=5002, debug=False, threaded=True)

完成上述操作后，在终端中输入以下指令即可启动项目：

[En]

After completing the above operations, enter the following instructions in the terminal to start the project:

$ python app.py

3.7 效果展示

netstat可以列出正在侦听的所有 TCP或 UDP端口，包括使用端口和套接字状态的服务。

$ netstat -tunlp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name
tcp        0      0 0.0.0.0:7687            0.0.0.0:*               LISTEN      1241/java
tcp        0      0 0.0.0.0:5002            0.0.0.0:*               LISTEN      1727/python
tcp        0      0 0.0.0.0:7474            0.0.0.0:*               LISTEN      1241/java
tcp        0      0 127.0.0.1:60061         0.0.0.0:*               LISTEN      1753/python
tcp        0      0 127.0.0.1:60062         0.0.0.0:*               LISTEN      1779/python

-t：显示 TCP 端口
-u：显示 UDP 端口
-n：显示数字地址而不是主机名
-l：仅显示侦听端口
-p：显示进程的 PID 和名称

这时在本机的浏览器上输入 localhost:5002即可成功打开项目页面了！

搭建项目镜像

现在把项目所在的容器封装成镜像，方便不同系统上的部署。这里我采用两种方法搭建，分别是 Docker commit和 Dockerfile搭建项目镜像。

4.1 Docker commit搭建

在Docker中，镜像是多层存储，每一层是在前一层的基础上进行的修改；而容器同样也是多层存储，是在以镜像为基础层，在其基础上加一层作为容器运行时的存储层。

在该项目中，我们是在 tensorflow镜像的基础上创建了 diagnosis这个容器，并在该容器中进行了修改操作。可以通过 docker diff 命令看到具体的改动。

$ docker diff CONTAINER

docker commit 命令可以将容器的存储层保存下来成为镜像。换句话说，就是在原有镜像的基础上，再叠加上容器的存储层，并构成新的镜像。 docker commit 的语法格式为：

$ docker commit [选项] <容器ID或容器名> [<仓库名>[:<标签>]]

在这个项目中，我使用以下说明来构建项目映像：

[En]

In this project, I use the following instructions to build the project image:

$ docker commit --author "xxxx" --message "Diagnosis Chatbot Project" diagnosis username/image:tag

其中 --author 是指定作者，而 --message 则是记录本次修改的内容。这点和 git 版本控制相似，不过这里这些信息也可以省略不写。 需要注意的是仓库名必须是小写。

用 docker image ls指令可以查看我们新创建的镜像。

使用 docker run指令可以根据项目镜像生成项目容器，该容器已经配置好环境了，在容器中直接启动服务即可。

4.2 Dockerfile搭建

后续会计划打算用Dockerfile构建这个项目的镜像。

发布项目镜像

将有 Docker commit搭建好的项目镜像推送到远端仓库中，指令如下：

$ docker push username/image:tag

Original: https://blog.csdn.net/weixin_46003347/article/details/123623025
Author: 暄踽
Title: 医疗问答机器人项目部署

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/509105/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ubuntu-server20.04 静态ip cuda11.2 cudnn conda虚拟环境 opencv h264

修改静态ip ifconfig可以查看，所有网络属性转到网络配置目录cd /etc/netplan 查看文件ls 修改文件sudo vim 文件名.yaml 例：sudo vim…

人工智能 2023年7月20日
0079
知识图谱_知识图谱—知识存储

导读： 1.知识提取从原始数据语料中自动识别出命名实体。实体是知识图谱中最基本的元素。 Kaikai：知识图谱—知识提取zhuanlan.zhihu.com 2.知识表示（一）…

人工智能 2023年6月10日
0057
【快速理解Adagrad】通俗解释Adagrad梯度下降算法

算法背景：传统的人工神经网络基本只有输入层、隐藏层、以及输出层。随着大数据时代的来临以及GPU算力的提升，更加深层的神经网络出现了，使得人工智能进入深度学习时代。更深层的神经网络…

人工智能 2023年6月25日
0074
【遥感分类】目视解译分类精度评价

引：网上已有很多ENVI遥感影像分类教程，但基本都是关于【使用ENVI分类器进行遥感影像分类→继续使用ENVI进行精度评价】，缺少关于【使用ArcGIS目视解译进行遥感影像分类→转…

人工智能 2023年7月2日
00118
图像平滑之二维离散卷积

本书是数字图像处理_经典著作，作者在对32个国家的134个院校和研究所的教师，学生及自学者进行广泛调查的基础上编写了第三版。除保留了第二版的大部分主要内容外，还根据收集的建议从1…

人工智能 2023年5月28日
0073
数据库仓库管理系统课程设计

库存表—–Storage create table Storage ( Gno char (4) primary key, Sno char (4) not…

人工智能 2023年7月30日
0054
六自由度机器人（机械臂）运动学建模及运动规划系列（四）——轨迹规划

本篇目录 * – 一、轨迹规划概述 – 二、关节空间规划 – + 1. 点对点规划 + 2. 多节点规划 + * 示例程序 – 三、…

人工智能 2023年6月26日
00102
AB实验原理及案例实例（python代码实现）

1.背景介绍：AB实验的由来在产品迭代过程中，每一个功能点的改进不是产品经理靠经验和拍脑袋想出来的，这就需要我们设置一个对照实验来分析功能点的改进对于我们所关注的核心指标是否有改…

人工智能 2023年7月16日
0074
Rasa课程、Rasa培训、Rasa面试、Rasa实战系列之Typo Robustness

Rasa课程、Rasa培训、Rasa面试、Rasa实战系列之Typo Robustness ; taipo taipo是一个错字拼写错误，意思是 evil spirit 此应用程序…

人工智能 2023年7月9日
0072
机器学习算法汇总：回归算法

1、线性回归（1）分类：一元线性回归、多元线性回归（2）优缺点分析：优点：模型简单、运算量小，即使数据量很大，仍然可以快速得到结果模型的参数就是特征的权重，具有很好的解释性…

人工智能 2023年6月18日
0076
python pandas数据清洗_常用pandas清洗数据命令

pandas清洗数据常用命令安装jupyter notebook 启动 jupyter 可以在里面编写python代码 1、加载数据df = pd.DataFrame(pd.r…

人工智能 2023年7月8日
0050
免费将中文视频转换为英文视频并添加中英双语字幕

人工智能 2023年5月23日
00190
核酸检测小程序实战教程

目录 1 前言 2 数据源设计 * 2.1 检测点数据源 2.2 受检人数据源 2.3 核酸预约数据源 3 创建模型应用 4 创建小程序 5 首页开发 6 检测点页面开发 7 受检…

人工智能 2023年5月30日
0079
数据分析day7

1、pandas中对齐运算 import numpy as np import pandas as pd ser_obj1 = pd.Series(range(10,20),ind…

人工智能 2023年7月7日
0062
2022年给正在创作的程序员的实用工具

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0082
CycleGAN的pytorch代码实现（代码详细注释）

CycleGAN代码参考代码 CycleGAN原理代码介绍 * models datasets utils cycle_gan test 训练结果放在一个文件里参考代码 &…

人工智能 2023年7月3日
00132

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

医疗问答机器人项目部署

文章目录

2.1 更换软件源

2.2 下载vim

2.3 解决vim中文乱码问题

2.4 安装Neo4J图数据库

2.5 安装网络工具包

3.1 拷贝项目到容器中

3.2 安装项目所需的工具包

3.3 导入数据

3.4 打开实体抽取服务

3.5 打开意图识别服务

3.6 打开问答助手服务

3.7 效果展示

4.1 Docker commit搭建

4.2 Dockerfile搭建

大家都在看