知识图谱推荐之neo4j电影智能问答项目

2023年6月1日下午2:58 • 人工智能 • 阅读 85

申明：此项目是由”跟若海写代码”公众号发布内容整理而来，侵删。

适用：知识图谱推荐入门项目、熟悉neo4j图数据库一般操作等。

1 项目需求分析与方案设计

1.1 需求分析

1.1.1 功能需求

用户的功能需求只有1个，回答用户电影相关的提问。

具体可以细化为以下几种类型：

通过演员问电影，比如某某演员演过哪些电影；
问演员的相关信息，比如某个演员的介绍；
通过电影问演员，比如某某电影包括哪些演员；
问电影的相关信息，比如某某电影的评分是多少，某某电影的剧情是什么；
根据类型问电影，比如某某类型的电影有哪些；
结合演员和评分进行提问，比如某某演员评分大于某值的电影有哪些；
结合电影类型和演员进行提问。

1.1.2 使用需求

需求指出需要通过web应用的形式提供给用户，因此项目应该包含如下几个部分：

web前端
API接口层
算法服务层
数据存储层

1.1.3 性能需求（略）

1.2 产品设计

通过需求分析，进行产品设计，主要包括UI设计和交互设计。设计了两种不同风格的UI形式，一种是聊天机器人的形式，一种是传统搜索的形式。

聊天机器人版

UI界面如下图所示，交互采用被动单轮对话的形式，具体如下。
即整体应用以对话的形式展开，但只是被动的对话，只有当用户输入问题时，应用才会进行响应；
单轮对话，即只用户输入一个问题，系统只输出一个回答，多个问答之间没有关联。
如果应用可以回答问题，则输出答案，如果系统无法识别问题或者没有相关数据，则输出我也不知道答案。
用户首次进入聊天页面时，会提示用户支持的问题类型，并给出几个参考问题。

搜索版

应用整体上以搜索的形式呈现，页面分为三大部分。
第1部分是搜索框和回答区；
第2部分是问题类型提示；
第3部分是应用支持的电影种类、部分电影名称、部分演员列表。

2 搭建项目

2.1 配置环境

2.1.1 安装软件和库

安装python包管理工具conda
安装python集成开发环境pycharm

参考资料：

《python环境搭建和基础语法》深度学习环境搭建，1 Python环境搭建和基础语法_哔哩哔哩_bilibili
《minicode和jupyter环境搭建》深度学习环境搭建，2 minicode和jupyter环境搭建_哔哩哔哩_bilibili

2.1.2 安装依赖包

使用conda创建虚拟环境
安装依赖包

*
– numpy
– pandas
– scikit-learn
– py2neo
– matplotlib
– flask

2.2 项目结构

*
– run.py
– run_script.py

三层架构

*
– model层
+ question_classify_model.py
+ question_template.py
– service层
+ question_service.py
– controller层
+ qa_server.py

静态网页

*
– templates
– static

*
– common 基础代码，通用代码
– data 数据
– script 脚本

2.3 编写数据库层

电影数据属性图建模

关系型电影数据

电影类别csv前5行

gid,gname 12,&#x5192;&#x9669; 14,&#x5947;&#x5E7B; 16,&#x52A8;&#x753B; 18,&#x5267;&#x60C5;

电影csv前5行

"mid","title","introduction","rating","releasedate" "13","Forrest Gump","&#x963F;&#x7518;&#xFF08;&#x6C64;&#x59C6;&#xB7;&#x6C49;&#x514B;&#x65AF; Tom Hanks &#x9970;&#xFF09;&#x4E8E;&#x4E8C;&#x6218;&#x7ED3;&#x675F;&#x540E;&#x4E0D;&#x4E45;&#x51FA;&#x751F;&#x5728;&#x7F8E;&#x56FD;&#x5357;&#x65B9;&#x963F;&#x62C9;&#x5DF4;&#x9A6C;&#x5DDE;&#x4E00;&#x4E2A;&#x95ED;&#x585E;&#x7684;&#x5C0F;&#x9547;&#xFF0C;&#x4ED6;&#x5148;&#x5929;&#x5F31;&#x667A;&#xFF0C;&#x667A;&#x5546;&#x53EA;&#x6709;75&#xFF0C;&#x7136;&#x800C;&#x4ED6;&#x7684;&#x5988;&#x5988;&#x662F;&#x4E00;&#x4E2A;&#x6027;&#x683C;&#x575A;&#x5F3A;&#x7684;&#x5973;&#x6027;&#xFF0C;&#x5979;&#x5E38;&#x5E38;&#x9F13;&#x52B1;&#x963F;&#x7518;&#x201C;&#x50BB;&#x4EBA;&#x6709;&#x50BB;&#x798F;&#x201D;&#xFF0C;&#x8981;&#x4ED6;&#x81EA;&#x5F3A;&#x4E0D;&#x606F;&#x3002;&#x963F;&#x7518;&#x50CF;&#x666E;&#x901A;&#x5B69;&#x5B50;&#x4E00;&#x6837;&#x4E0A;&#x5B66;&#xFF0C;&#x5E76;&#x4E14;&#x8BA4;&#x8BC6;&#x4E86;&#x4E00;&#x751F;&#x7684;&#x670B;&#x53CB;&#x548C;&#x81F3;&#x7231;&#x73CD;&#x59AE;&#xFF08;&#x7F57;&#x5BBE;&#xB7;&#x83B1;&#x7279;&#xB7;&#x6F58; Robin Wright Penn &#x9970;&#xFF09;&#xFF0C;&#x5728;&#x73CD;&#x59AE;&#x548C;&#x5988;&#x5988;&#x7684;&#x7231;&#x62A4;&#x4E0B;&#xFF0C;&#x963F;&#x7518;&#x51ED;&#x7740;&#x4E0A;&#x5E1D;&#x8D50;&#x4E88;&#x7684;&#x201C;&#x98DE;&#x6BDB;&#x817F;&#x201D;&#x5F00;&#x59CB;&#x4E86;&#x4E00;&#x751F;&#x4E0D;&#x505C;&#x7684;&#x5954;&#x8DD1;&#x3002;&#x963F;&#x7518;&#x6210;&#x4E3A;&#x6A44;&#x6984;&#x7403;&#x5DE8;&#x661F;&#x3001;&#x8D8A;&#x6218;&#x82F1;&#x96C4;&#x3001;&#x4E52;&#x4E53;&#x7403;&#x5916;&#x4EA4;&#x4F7F;&#x8005;&#x3001;&#x4EBF;&#x4E07;&#x5BCC;&#x7FC1;&#xFF0C;&#x4F46;&#x662F;&#xFF0C;&#x4ED6;&#x59CB;&#x7EC8;&#x5FD8;&#x4E0D;&#x4E86;&#x73CD;&#x59AE;&#xFF0C;&#x51E0;&#x6B21;&#x5306;&#x5306;&#x7684;&#x76F8;&#x805A;&#x548C;&#x79BB;&#x522B;&#xFF0C;&#x66F4;&#x662F;&#x52A0;&#x6DF1;&#x4E86;&#x963F;&#x7518;&#x7684;&#x601D;&#x5FF5;&#x3002;&#x6709;&#x4E00;&#x5929;&#xFF0C;&#x963F;&#x7518;&#x6536;&#x5230;&#x73CD;&#x59AE;&#x7684;&#x4FE1;&#xFF0C;&#x4ED6;&#x4EEC;&#x7EC8;&#x4E8E;&#x53C8;&#x8981;&#x89C1;&#x9762;&#x2026;","8.300000190734863","1994-07-06" "24","Kill Bill: Vol. 1","&#x65B0;&#x5A18;&#xFF08;&#x4E4C;&#x739B;&#xB7;&#x745F;&#x66FC;&#x9970;&#xFF09;&#x66FE;&#x7ECF;&#x662F;&#x81F4;&#x547D;&#x6BD2;&#x86C7;&#x6697;&#x6740;&#x5C0F;&#x7EC4;&#xFF08;D&#xFF0E;I&#xFF0E;V&#xFF0E;A&#xFF0E;S&#xFF09;&#x7684;&#x4E00;&#x5458;&#xFF0C;&#x4F01;&#x56FE;&#x901A;&#x8FC7;&#x7ED3;&#x5A5A;&#x8131;&#x79BB;&#x8840;&#x8165;&#x7684;&#x751F;&#x6D3B;&#x3002;&#x4F46;&#x662F;&#x5979;&#x7684;&#x524D;&#x540C;&#x50DA;&#xFF08;&#x6C49;&#x7EB3;&#x3001;&#x5218;&#x7389;&#x73B2;&#x3001;&#x8587;&#x8587;&#x5361;&#xB7;A&#xB7;&#x798F;&#x514B;&#x65AF;&#x3001;&#x8FC8;&#x514B;&#x5C14;&#xB7;&#x9A6C;&#x5FB7;&#x68EE;&#x7B49;&#x4EBA;&#x626E;&#x6F14;&#xFF09;&#x4EE5;&#x53CA;&#x6240;&#x6709;&#x4EBA;&#x7684;&#x8001;&#x677F;&#x6BD4;&#x5C14;&#xFF08;&#x5927;&#x536B;&#xB7;&#x5361;&#x62C9;&#x4E01;&#x9970;&#xFF09;&#x7684;&#x5230;&#x6765;&#x7834;&#x574F;&#x4E86;&#x8FD9;&#x4E00;&#x5207;&#x3002;&#x201C;&#x6BD4;&#x5C14;&#xFF0C;&#x201D;&#x65B0;&#x5A18;&#x8BF7;&#x6C42;&#x8BF4;&#xFF0C;&#x201C;&#x6211;&#x6000;&#x5B55;&#x4E86;&#xFF0C;&#x662F;&#x4F60;&#x7684;&#x5B69;&#x5B50;&#x3002;&#x201D;&#x4F46;&#x662F;&#x56DE;&#x7B54;&#x5979;&#x7684;&#x662F;&#x201C;&#x7830;&#x201D;&#x7684;&#x4E00;&#x58F0;&#x67AA;&#x54CD;&#xFF01;4&#x5E74;&#x540E;&#x5979;&#x5728;&#x4E00;&#x5BB6;&#x533B;&#x9662;&#x9192;&#x6765;&#xFF0C;&#x5C31;&#x7ACB;&#x523B;&#x5F00;&#x59CB;&#x7740;&#x624B;&#x4E00;&#x6B21;&#x4ECE;&#x5F97;&#x514B;&#x8428;&#x65AF;&#x5230;&#x51B2;&#x7EF3;&#x3001;&#x4E1C;&#x4EAC;&#x4EE5;&#x53CA;&#x58A8;&#x897F;&#x54E5;&#x7684;&#x590D;&#x4EC7;&#x4E4B;&#x65C5;&#xFF0C;&#x4E3A;&#x4E86;&#x4E00;&#x4E2A;&#x76EE;&#x6807;&#x5979;&#x8981;&#x5927;&#x5F00;&#x6740;&#x6212;&#x3002;&#x201C;&#x5F53;&#x6211;&#x5230;&#x8FBE;&#x76EE;&#x7684;&#x5730;&#x4E4B;&#x540E;&#xFF0C;&#x6211;&#x5C06;&#x6740;&#x6B7B;&#x6BD4;&#x5C14;&#x3002;&#x201D;","7.800000190734863","2003-10-10" "79","&#x82F1;&#x96C4;","&#x6218;&#x56FD;&#x672B;&#x671F;&#xFF0C;&#x8D75;&#x56FD;&#x6709;&#x4E09;&#x4E2A;&#x540D;&#x9707;&#x5929;&#x4E0B;&#x7684;&#x4FA0;&#x5BA2;&#xFF0C;&#x4ED6;&#x4EEC;&#x662F;&#xFF1A;&#x201C;&#x957F;&#x7A7A;&#x201D;&#x3001;&#x201C;&#x6B8B;&#x5251;&#x201D;&#x3001;&#x201C;&#x98DE;&#x96EA;&#x201D;&#x3002;&#x56E0;&#x4E3A;&#x4ED6;&#x4EEC;&#xFF0C;&#x79E6;&#x738B;&#x5341;&#x5E74;&#x91CC;&#x6CA1;&#x7761;&#x8FC7;&#x4E00;&#x4E2A;&#x5B89;&#x7A33;&#x89C9;&#x3002;&#x53EF;&#x662F;&#x4ED6;&#x4EEC;&#x5374;&#x88AB;&#x4E00;&#x4E2A;&#x9ED8;&#x9ED8;&#x65E0;&#x95FB;&#xFF0C;&#x540D;&#x53EB;&#x65E0;&#x540D;&#x7684;&#x79E6;&#x56FD;&#x5251;&#x5BA2;&#x6240;&#x6740;&#x3002;&#x6D88;&#x606F;&#x4F20;&#x6765;&#xFF0C;&#x79E6;&#x738B;&#x632F;&#x594B;&#xFF0C;&#x6025;&#x53EC;&#x65E0;&#x540D;&#x4E0A;&#x6BBF;&#x76F8;&#x89C1;&#x3002;&#x5728;&#x79E6;&#x738B;&#x7684;&#x5927;&#x6BBF;&#x91CC;&#xFF0C;&#x795E;&#x79D8;&#x7684;&#x70DB;&#x706B;&#x71C3;&#x70E7;&#x7740;&#xFF0C;&#x79E6;&#x738B;&#x4E0E;&#x65E0;&#x540D;&#x53EA;&#x6709;&#x5341;&#x6B65;&#x7684;&#x8DDD;&#x79BB;&#xFF0C;&#x65E0;&#x540D;&#x5C06;&#x51FB;&#x6740;&#x957F;&#x7A7A;&#x3001;&#x6B8B;&#x5251;&#x3001;&#x98DE;&#x96EA;&#x7684;&#x6545;&#x4E8B;&#x5A13;&#x5A13;&#x9053;&#x6765;&#xFF1A;&#x4ED6;&#x5229;&#x7528;&#x4E09;&#x4EBA;&#x4E4B;&#x95F4;&#x7231;&#x6068;&#x4EA4;&#x7EC7;&#x7684;&#x5173;&#x7CFB;&#xFF0C;&#x74E6;&#x89E3;&#x4E86;&#x4ED6;&#x4EEC;&#x7684;&#x529B;&#x91CF;&#xFF0C;&#x5404;&#x4E2A;&#x51FB;&#x7834;&#xFF0C;&#x56E0;&#x6B64;&#x53D6;&#x80DC;&#x3002;&#x53EF;&#x79E6;&#x738B;&#x673A;&#x667A;&#x8FC7;&#x4EBA;&#xFF0C;&#x542C;&#x51FA;&#x4E86;&#x65E0;&#x540D;&#x6545;&#x4E8B;&#x4E2D;&#x7684;&#x7834;&#x7EFD;&#xFF0C;&#x8BF4;&#x51FA;&#x4E86;&#x53E6;&#x4E00;&#x4E2A;&#x6545;&#x4E8B;&#x7684;**&#xFF1A;&#x6B8B;&#x5251;&#x7B49;&#x4E09;&#x4EBA;&#x662F;&#x4E3B;&#x52A8;&#x6C42;&#x8D25;&#xFF0C;&#x732E;&#x51FA;&#x751F;&#x547D;&#xFF0C;&#x7528;&#x82E6;&#x8089;&#x8BA1;&#x5E2E;&#x52A9;&#x65E0;&#x540D;&#x4E0A;&#x6BBF;&#xFF0C;&#x65E0;&#x540D;&#x624D;&#x662F;&#x771F;&#x6B63;&#x6700;&#x5371;&#x9669;&#x7684;&#x523A;&#x5BA2;&#xFF0C;&#x800C;&#x65E0;&#x540D;&#x544A;&#x8BC9;&#x79E6;&#x738B;&#xFF1A;&#x4ED6;&#x770B;&#x9519;&#x4E86;&#x4E00;&#x4E2A;&#x4EBA;&#xFF0C;&#x90A3;&#x5C31;&#x662F;&#x6B8B;&#x5251;&#x3002;&#x4E8E;&#x662F;&#x771F;&#x6B63;&#x7684;&#x6545;&#x4E8B;&#x4ECE;&#x5934;&#x53D9;&#x8D77;&#x2026;&#x2026;&#x6700;&#x540E;&#xFF0C;&#x65E0;&#x540D;&#x62FF;&#x8D77;&#x4E86;&#x5251;&#xFF0C;&#x6B64;&#x65F6;&#x4ED6;&#x79BB;&#x79E6;&#x738B;&#x53EA;&#x6709;&#x5341;&#x6B65;&#xFF0C;&#x4ED6;&#x7684;&#x7EDD;&#x6280;&#x662F;&#x201C;&#x5341;&#x6B65;&#x4E00;&#x6740;&#x201D;&#x3002;","7.300000190734863","2002-12-19" "82","Miami Vice","&#x6545;&#x4E8B;&#x80CC;&#x666F;&#x4ECE;&#x4E0A;&#x4E16;&#x7EAA;80&#x5E74;&#x4EE3;&#x53D8;&#x6210;&#x4E86;&#x73B0;&#x4EE3;&#x7684;&#x8FC8;&#x963F;&#x5BC6;&#xFF0C;&#x7F8E;&#x56FD;&#x5357;&#x90E8;&#x57CE;&#x5E02;&#x8FC8;&#x963F;&#x5BC6;&#x4E00;&#x76F4;&#x4EE5;&#x6765;&#x90FD;&#x662F;&#x6BD2;&#x54C1;&#x72AF;&#x7F6A;&#x7684;&#x201C;&#x8302;&#x76DB;&#x201D;&#x7E41;&#x6B96; &#x5730;&#x3002;&#x7F8E;&#x56FD;&#x8054;&#x90A6;&#x8C03;&#x67E5;&#x5C40;&#xFF08;FBI&#xFF09;&#x66F4;&#x662F;&#x4ECE;&#x6765;&#x90FD;&#x6CA1;&#x6709;&#x653E;&#x677E;&#x8FC7;&#x5BF9;&#x8FD9;&#x4E00;&#x5E26;&#x5730;&#x533A;&#x7684;&#x76D1;&#x63A7;&#xFF0C;&#x5C24;&#x5176;&#x662F;&#x90A3;&#x4E9B;&#x4EAB;&#x8A89;&#x62C9;&#x7F8E;&#x7684;&#x5927;&#x6BD2;&#x67AD;&#x4EEC;&#xFF0C;&#x65E9;&#x5DF2;&#x6210;&#x4E3A;&#x4E86;&#x8B66;&#x65B9;&#x6700;&#x4E3A;&#x5173;&#x6CE8;&#x7684;&#x7126;&#x70B9;&#x3002;&#x5F53;&#x524D;&#xFF0C;&#x6B63;&#x6709;&#x4E00;&#x4E2A;&#x68D8;&#x624B;&#x7684;&#x5927;&#x5B97;&#x6BD2;&#x54C1;&#x8D70;&#x79C1;&#x6848;&#x5728;&#x7D27;&#x5F20;&#x7684;&#x8C03;&#x67E5;&#x4E2D;&#x3002;&#x8FC8;&#x963F;&#x5BC6;&#x8B66;&#x65B9;&#x81EA;&#x7136;&#x4E5F;&#x6D3E;&#x51FA;&#x4E86;&#x591A;&#x4F4D;&#x7CBE;&#x660E;&#x5F3A;&#x5E72;&#x7684;&#x8B66;&#x63A2;&#x53C2;&#x4E0E;&#x5176;&#x4E2D;&#xFF0C;&#x9ED1;&#x4EBA;&#x8B66;&#x5BDF;&#x91CC;&#x5361;&#x591A;&#xFF08;&#x6770;&#x7C73;&#xB7;&#x798F;&#x514B;&#x65AF;&#xFF09;&#x4E0E;&#x8A79;&#x59C6;&#x65AF;&#xB7;&#x79D1;&#x7F57;&#x51EF;&#x7279;&#xFF08;&#x67EF;&#x6797;&#xB7;&#x6CD5;&#x745E;&#x5C14;&#xFF09;&#x4E00;&#x4E2A;&#x6B63;&#x9762;&#x8FFD;&#x67E5;&#x6BD2;&#x54C1;&#x8D70;&#x79C1;&#x7684;&#x7EBF;&#x8DEF;&#xFF0C;&#x4E00;&#x4E2A;&#x5219;&#x5047;&#x626E;&#x6210;&#x5C0F;&#x6BD2;&#x8D29;&#xFF0C;&#x5367;&#x5E95;&#x4E8E;&#x4E00;&#x4E2A;&#x8F83;&#x5927;&#x7684;&#x8D29;&#x6BD2;&#x56E2;&#x4F19;&#x5185;&#x3002;&#x7136;&#x800C;&#xFF0C;&#x5728;&#x65F6;&#x95F4;&#x4E0D;&#x957F;&#x7684;&#x5367;&#x5E95;&#x8C03;&#x67E5;&#x4E2D;&#xFF0C;&#x4E2A;&#x6027;&#x5938;&#x5F20;&#x7684;&#x8A79;&#x59C6;&#x65AF;&#x4E0D;&#x77E5;&#x4E0D;&#x89C9;&#x4E2D;&#x9677;&#x5165;&#x4E86;&#x4E0E;&#x6027;&#x611F;&#x5973;&#x94F6;&#x884C;&#x5BB6;&#x4F0A;&#x838E;&#x8D1D;&#x62C9;&#xFF08;&#x5DE9;&#x4FD0;&#xFF09;&#x7684;&#x79C1;&#x5BC6;&#x604B;&#x60C5;&#x4E4B;&#x4E2D;&#x3002;&#x7136;&#x800C;&#xFF0C;&#x8FD9;&#x4E2A;&#x4E9A;&#x88D4;&#x5973;&#x4EBA;&#x5B9E;&#x9645;&#x4E0A;&#x5C31;&#x662F;&#x672C;&#x5730;&#x6BD2;&#x54C1;&#x8D70;&#x79C1;&#x96C6;&#x56E2;&#x5E55;&#x540E;&#x7684;&#x91CD;&#x8981;&#x5934;&#x76EE;&#xFF0C;&#x5E76;&#x4E14;&#x662F;&#x8FDC;&#x8FD1;&#x95FB;&#x540D;&#x7684;&#x5927;&#x6BD2;&#x67AD;&#x517C;&#x519B;&#x706B;&#x5546;&#x8499;&#x6258;&#x4E9A;&#xFF08;&#x8DEF;&#x6613;&#x65AF;&#xB7;&#x591A;&#x8428;&#xFF09;&#x7684;&#x5973;&#x4EBA;&#x3002;&#x4E24;&#x4EBA;&#x79BB;&#x5947;&#x7684;&#x604B;&#x60C5;&#x7ED9;&#x6574;&#x4E2A;&#x6848;&#x4EF6;&#x7684;&#x4FA6;&#x7834;&#x5E26;&#x6765;&#x4E86;&#x7A7A;&#x524D;&#x7684;&#x9EBB;&#x70E6;&#x548C;&#x5371;&#x9669;&#x3002;&#x201C;&#x9ED1;&#x767D;&#x5E72;&#x63A2;&#x201D;&#x3001;&#x6027;&#x611F;&#x5973;&#x6BD2;&#x72AF;&#x4EE5;&#x53CA;&#x51F6;&#x6B8B;&#x7684;&#x5927;&#x6BD2;&#x67AD;&#x2026;&#x2026;&#x6240;&#x6709;&#x7684;&#x4E00;&#x5207;&#x201C;&#x9ED1;&#x767D;&#x4E4B;&#x7269;&#x201D;&#x90FD;&#x5728;&#x4E00;&#x77AC;&#x95F4;&#x7EA0;&#x7F20;&#x5728;&#x4E86;&#x4E00;&#x8D77;&#x3002;","5.699999809265137","2006-07-27"

&#x7535;&#x5F71;&#x548C;&#x7C7B;&#x522B;&#x5173;&#x7CFB;csv&#x524D;5&#x884C;
"mid","gid" "79","12" "82","12" "87","12" "146","12"

&#x4EBA;&#x7269;csv&#x524D;5&#x884C;
"pid","birth","death","name","biography","birthplace" "643","1965-12-31",\N,"&#x5DE9;&#x4FD0;","&#x65B0;&#x52A0;&#x5761;&#x534E;&#x88D4;&#x5973;&#x6F14;&#x5458;&#xFF0C;&#x7956;&#x7C4D;&#x4E2D;&#x56FD;&#x5C71;&#x4E1C;&#xFF0C;&#x6BD5;&#x4E1A;&#x4E8E;&#x4E2D;&#x592E;&#x620F;&#x5267;&#x5B66;&#x9662;&#xFF0C;&#x8054;&#x5408;&#x56FD;&#x4FC3;&#x8FDB;&#x548C;&#x5E73;&#x827A;&#x672F;&#x5BB6;&#xFF0C;&#x8054;&#x5408;&#x56FD;&#x5168;&#x7403;&#x73AF;&#x5883;&#x4FDD;&#x62A4;&#x5927;&#x4F7F;&#x3002;1987&#x5E74;&#xFF0C;&#x56E0;&#x4E3B;&#x6F14;&#x7535;&#x5F71;&#x300A;&#x7EA2;&#x9AD8;&#x7CB1;&#x300B;&#x6210;&#x540D;&#xFF0C;&#x8BE5;&#x7247;&#x83B7;&#x5F97;&#x67CF;&#x6797;&#x7535;&#x5F71;&#x8282;&#x91D1;&#x718A;&#x5956;&#x3002;1992&#x5E74;&#xFF0C;&#x51ED;&#x501F;&#x4E3B;&#x6F14;&#x7684;&#x7535;&#x5F71;&#x300A;&#x79CB;&#x83CA;&#x6253;&#x5B98;&#x53F8;&#x300B;&#x83B7;&#x5F97;&#x5A01;&#x5C3C;&#x65AF;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x6700;&#x4F73;&#x5973;&#x6F14;&#x5458;&#x5956;&#xFF0C;&#x8BE5;&#x7247;&#x4EA6;&#x83B7;&#x5F97;&#x91D1;&#x72EE;&#x5956;&#x3002;1993&#x5E74;&#xFF0C;&#x4E3B;&#x6F14;&#x7684;&#x7535;&#x5F71;&#x300A;&#x9738;&#x738B;&#x522B;&#x59EC;&#x300B;&#x83B7;&#x5F97;&#x91D1;&#x68D5;&#x6988;&#x5956;&#xFF0C;&#x56E0;&#x800C;&#x5DE9;&#x4FD0;&#x6210;&#x4E3A;&#x4E16;&#x754C;&#x5F71;&#x53F2;&#x7B2C;&#x4E8C;&#x4F4D;&#x4E3B;&#x6F14;&#x5F71;&#x7247;&#x5305;&#x63FD;&#x6B27;&#x6D32;&#x4E09;&#x5927;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x5F71;&#x7247;&#x5956;&#x7684;&#x6F14;&#x5458;&#x3002;1993&#x5E74;&#xFF0C;&#x83B7;&#x5F97;&#x67CF;&#x6797;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x91D1;&#x6444;&#x5F71;&#x673A;&#x5956;&#x5E76;&#x4E0A;&#x699C;&#x7F8E;&#x56FD;&#x300A;&#x4EBA;&#x7269;&#x300B;&#x5168;&#x7403;&#x6700;&#x7F8E;50&#x4EBA;&#x3002;1996&#x5E74;&#xFF0C;&#x767B;&#x4E0A;&#x7F8E;&#x56FD;&#x300A;&#x65F6;&#x4EE3;&#x5468;&#x520A;&#x300B;&#x5C01;&#x9762;&#x5E76;&#x4E0A;&#x699C;&#x5168;&#x7403;&#x5341;&#x5927;&#x4EBA;&#x7269;&#x3002;1997&#x5E74;&#xFF0C;&#x62C5;&#x4EFB;&#x621B;&#x7EB3;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x8BC4;&#x59D4;&#x4F1A;&#x6210;&#x5458;&#x3002;2000&#x5E74;&#xFF0C;&#x62C5;&#x4EFB;&#x67CF;&#x6797;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x8BC4;&#x59D4;&#x4F1A;&#x4E3B;&#x5E2D;&#xFF1B;&#x540C;&#x5E74;&#xFF0C;&#x83B7;&#x5F97;&#x8499;&#x7279;&#x5229;&#x5C14;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x6700;&#x4F73;&#x5973;&#x6F14;&#x5458;&#x5956;&#x53CA;&#x827A;&#x672F;&#x6210;&#x5C31;&#x5927;&#x5956;&#x3002;2002&#x5E74;&#xFF0C;&#x62C5;&#x4EFB;&#x5A01;&#x5C3C;&#x65AF;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x8BC4;&#x59D4;&#x4F1A;&#x4E3B;&#x5E2D;&#x3002;2003&#x5E74;&#xFF0C;&#x62C5;&#x4EFB;&#x4E1C;&#x4EAC;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x8BC4;&#x59D4;&#x4F1A;&#x4E3B;&#x5E2D;&#x3002;2004&#x5E74;&#xFF0C;&#x83B7;&#x5F97;&#x621B;&#x7EB3;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x7EAA;&#x5FF5;&#x5927;&#x5956;&#xFF1B;&#x540C;&#x5E74;&#xFF0C;&#x4E0A;&#x699C;&#x7F8E;&#x56FD;&#x300A;&#x9996;&#x6620;&#x300B;&#x5F71;&#x53F2;&#x767E;&#x5927;&#x4F1F;&#x5927;&#x8868;&#x6F14;&#x3002;2005&#x5E74;&#xFF0C;&#x5165;&#x9009;&#x4E2D;&#x56FD;&#x7535;&#x5F71;&#x767E;&#x5E74;50&#x4F4D;&#x6709;&#x7A81;&#x51FA;&#x8D21;&#x732E;&#x827A;&#x672F;&#x5BB6;&#x3002;2006&#x5E74;&#xFF0C;&#x4E0A;&#x699C;&#x7F8E;&#x56FD;&#x300A;&#x65F6;&#x4EE3;&#x5468;&#x520A;&#x300B;60&#x5E74;&#x4E9A;&#x6D32;&#x82F1;&#x96C4;&#xFF1B;&#x540C;&#x5E74;&#xFF0C;&#x4E0A;&#x699C;&#x7F8E;&#x56FD;&#x300A;&#x534E;&#x76DB;&#x987F;&#x90AE;&#x62A5;&#x300B;&#x5168;&#x7403;&#x5E74;&#x5EA6;5&#x4F4D;&#x4F1F;&#x5927;&#x6F14;&#x5458;&#x3002;2010&#x5E74;&#xFF0C;&#x6CD5;&#x56FD;&#x6587;&#x5316;&#x90E8;&#x6388;&#x4E88;&#x5176;&#x201C;&#x827A;&#x672F;&#x4E0E;&#x6587;&#x5B66;&#x52CB;&#x7AE0;&#x201D;&#x53F8;&#x4EE4;&#x52CB;&#x4F4D;&#x3002;2014&#x5E74;&#xFF0C;&#x62C5;&#x4EFB;&#x4E0A;&#x6D77;&#x56FD;&#x9645;&#x7535;&#x5F71;&#x8282;&#x8BC4;&#x59D4;&#x4F1A;&#x4E3B;&#x5E2D;&#xFF1B;&#x540C;&#x5E74;&#xFF0C;&#x4E8C;&#x5EA6;&#x4E0A;&#x699C;&#x65E5;&#x672C;&#x300A;&#x7535;&#x5F71;&#x65EC;&#x62A5;&#x300B;&#x767E;&#x5927;&#x5916;&#x56FD;&#x5973;&#x661F;&#x3002;2015&#x5E74;&#xFF0C;&#x5165;&#x9009;&#x8054;&#x5408;&#x56FD;16&#x4F4D;&#x5F71;&#x54CD;&#x4EBA;&#x7C7B;&#x6587;&#x5316;&#x827A;&#x672F;&#x5BB6;&#x3002;","Shenyang, Liaoning Province, China" "695","1937-03-16","1999-04-14","&#x4E54;&#x5B8F;","","Shanghai, China" "1336","1963-04-26",\N,"&#x674E;&#x8FDE;&#x6770;","&#x674E;&#x8FDE;&#x6770;&#xFF08;Jet Li&#xFF09;&#xFF0C;1963&#x5E74;4&#x6708;26&#x65E5;&#x751F;&#x4E8E;&#x5317;&#x4EAC;&#x5E02;&#xFF0C;&#x534E;&#x8BED;&#x5F71;&#x89C6;&#x7537;&#x6F14;&#x5458;&#x3001;&#x5BFC;&#x6F14;&#x3001;&#x5236;&#x4F5C;&#x4EBA; &#x3001;&#x6B66;&#x672F;&#x8FD0;&#x52A8;&#x5458;&#x3001;&#x5546;&#x4EBA;&#x3002;1971&#x5E74;&#x8FDB;&#x5165;&#x5317;&#x4EAC;&#x4EC0;&#x5239;&#x6D77;&#x4F53;&#x6821;&#xFF0C;&#x4ECE;&#x800C;&#x5F00;&#x59CB;&#x6B66;&#x672F;&#x8FD0;&#x52A8;&#x5458;&#x7684;&#x751F;&#x6DAF;&#x3002;1975&#x5E74;&#x53C2;&#x52A0;&#x5168;&#x8FD0;&#x4F1A;&#x6B66;&#x672F;&#x5957;&#x8DEF;&#x6BD4;&#x8D5B;&#xFF0C;&#x83B7;&#x5F97;&#x5168;&#x80FD;&#x51A0;&#x519B;&#x3002;1979&#x5E74;&#x56E0;&#x4F24;&#x9000;&#x51FA;&#x6B66;&#x672F;&#x754C;&#x3002;1982&#x5E74;&#x4E3B;&#x6F14;&#x4E2A;&#x4EBA;&#x9996;&#x90E8;&#x7535;&#x5F71;&#x300A;&#x5C11;&#x6797;&#x5BFA;&#x300B;&#xFF0C;&#x8BE5;&#x7247;&#x6253;&#x7834;&#x534E;&#x8BED;&#x7535;&#x5F71;&#x5728;&#x4E2D;&#x56FD;&#x5185;&#x5730;&#x7684;&#x7968;&#x623F;&#x7EAA;&#x5F55;&#x3002;1986&#x5E74;&#x81EA;&#x5BFC;&#x81EA;&#x6F14;&#x52A8;&#x4F5C;&#x7247;&#x300A;&#x4E2D;&#x534E;&#x82F1;&#x96C4;&#x300B;&#x3002;1991&#x5E74;&#x4E3B;&#x6F14;&#x7684;&#x52A8;&#x4F5C;&#x7247;&#x300A;&#x9EC4;&#x98DE;&#x9E3F;&#x4E4B;&#x58EE;&#x5FD7;&#x51CC;&#x4E91;&#x300B;&#x5960;&#x5B9A;&#x5176;&#x5728;&#x5F71;&#x575B;&#x7684;&#x5730;&#x4F4D;&#x3002;1992&#x5E74;&#x51ED;&#x501F;&#x6B66;&#x4FA0;&#x7247;&#x300A;&#x7B11;&#x50B2;&#x6C5F;&#x6E56;&#x2161;&#xFF1A;&#x4E1C;&#x65B9;&#x4E0D;&#x8D25;&#x300B;&#x83B7;&#x5F97;&#x66F4;&#x591A;&#x5173;&#x6CE8;&#x3002;1995&#x5E74;&#x83B7;&#x5F97;&#x7B2C;32&#x5C4A;&#x53F0;&#x6E7E;&#x7535;&#x5F71;&#x91D1;&#x9A6C;&#x5956;&#x5927;&#x9646;&#x4EBA;&#x58EB;&#x7279;&#x522B;&#x5956; &#x3002;1998&#x5E74;&#x8D74;&#x7F8E;&#x56FD;&#x597D;&#x83B1;&#x575E;&#x53D1;&#x5C55;&#xFF0C;&#x540C;&#x5E74;&#x51FA;&#x6F14;&#x5176;&#x5728;&#x597D;&#x83B1;&#x575E;&#x7684;&#x9996;&#x90E8;&#x7535;&#x5F71;&#x300A;&#x81F4;&#x547D;&#x6B66;&#x5668;4&#x300B;&#x3002;2001&#x5E74;&#x62C5;&#x4EFB;&#x52A8;&#x4F5C;&#x7247;&#x300A;&#x53D8;&#x79CD;&#x5143;&#x7D20;&#x300B;&#x7684;&#x5236;&#x4F5C;&#x4EBA;&#x3002;2002&#x5E74;&#x56E0;&#x4E3B;&#x6F14;&#x6B66;&#x4FA0;&#x7247;&#x300A;&#x82F1;&#x96C4;&#x300B;&#x800C;&#x6210;&#x4E3A;&#x7F8E;&#x56FD;&#x300A;&#x65F6;&#x4EE3;&#x5468;&#x520A;&#x300B;&#x7684;&#x5C01;&#x9762;&#x4EBA;&#x7269; &#x3002;2003&#x5E74;&#x51ED;&#x501F;&#x52A8;&#x4F5C;&#x7247;&#x300A;&#x5B87;&#x5B99;&#x8FFD;&#x7F09;&#x4EE4;&#x300B;&#x83B7;&#x5F97;&#x7B2C;12&#x5C4A;MTV&#x7535;&#x5F71;&#x5956;&#x6700;&#x4F73;&#x6253;&#x6597;&#x573A;&#x9762;&#x63D0;&#x540D;&#x3002;2008&#x5E74;&#x51ED;&#x501F;&#x52A8;&#x4F5C;&#x7247;&#x300A;&#x6295;&#x540D;&#x72B6;&#x300B;&#x83B7;&#x5F97;&#x7B2C;27&#x5C4A;&#x9999;&#x6E2F;&#x7535;&#x5F71;&#x91D1;&#x50CF;&#x5956;&#x6700;&#x4F73;&#x7537;&#x4E3B;&#x89D2; &#x3002;2009&#x5E74;&#x6210;&#x4E3A;&#x4E2D;&#x56FD;&#x4F01;&#x4E1A;&#x5BB6;&#x4FF1;&#x4E50;&#x90E8;&#x4F1A;&#x5458;&#x3002;2010&#x5E74;&#x5165;&#x9009;&#x7F8E;&#x56FD;&#x300A;&#x65F6;&#x4EE3;&#x5468;&#x520A;&#x300B;&#x201C;&#x5E74;&#x5EA6;&#x6700;&#x5177;&#x5F71;&#x54CD;&#x529B;&#x4EBA;&#x7269;&#x767E;&#x4EBA;&#x699C;&#x201D; &#x3002;2011&#x5E74;&#x53C2;&#x4E0E;&#x521B;&#x529E;&#x592A;&#x6781;&#x7985;&#x56FD;&#x9645;&#x6587;&#x5316;&#x53D1;&#x5C55;&#x6709;&#x9650;&#x516C;&#x53F8;&#x3002;2013&#x5E74;&#x5728;&#x300A;&#x4E2D;&#x534E;&#x6B66;&#x672F;&#x300B;&#x4E09;&#x5341;&#x5E74;&#x9881;&#x5956;&#x76DB;&#x5178;&#x4E2D;&#xFF0C;&#x83B7;&#x5F97;&#x201C;&#x4E2D;&#x534E;&#x6B66;&#x672F;30&#x5E74;&#x6700;&#x5177;&#x6B66;&#x672F;&#x5F71;&#x54CD;&#x529B;&#x4EBA;&#x7269;&#x5956;&#x201D;&#x3002;2016&#x5E74;&#x4E3B;&#x6F14;&#x53E4;&#x88C5;&#x7247;&#x300A;&#x5C01;&#x795E;&#x4F20;&#x5947;&#x300B; &#x3002;&#x674E;&#x8FDE;&#x6770;&#x70ED;&#x5FC3;&#x516C;&#x76CA;&#x6148;&#x5584;&#x3002;2007&#x5E74;&#x521B;&#x5EFA;&#x516C;&#x76CA;&#x7EC4;&#x7EC7;&#x58F9;&#x57FA;&#x91D1;&#x3002;2009&#x5E74;&#x62C5;&#x4EFB;&#x4E16;&#x754C;&#x536B;&#x751F;&#x7EC4;&#x7EC7;&#x4EB2;&#x5584;&#x5927;&#x4F7F;&#x3002;2010&#x5E74;&#x62C5;&#x4EFB;&#x56FD;&#x9645;&#x7EA2;&#x5341;&#x5B57;&#x4F1A;&#x4EB2;&#x5584;&#x5927;&#x4F7F;&#x3002;2014&#x5E74;&#x5728;&#x300A;&#x4E2D;&#x56FD;&#x6148;&#x5584;&#x5BB6;&#x300B;&#x201C;&#x4E2D;&#x56FD;&#x6148;&#x5584;&#x540D;&#x4EBA;&#x699C;&#x201D;&#x4E2D;&#x6392;&#x540D;&#x7B2C;&#x4E8C;&#x4F4D;&#x3002;","Beijing, China" "1337","1962-06-27",\N,"&#x6881;&#x671D;&#x4F1F;","","Hong Kong"

人物和电影关系csv前5行

"pid","mid" "163441","13" "240171","24" "1336","79" "1337","79"

电影属性图建模

电影数据导入

def load_genre():
    genre_node_cql = '''LOAD CSV WITH HEADERS FROM "file:///genre.csv" AS line
MERGE (p:Genre{gid:toInteger(line.gid),name:line.gname})
    '''
    movie_neo4j.run(genre_node_cql)

def load_person():
    person_node_cql = '''LOAD CSV WITH HEADERS FROM 'file:///person.csv' AS line
MERGE (p:Person { pid:toInteger(line.pid),birth:line.birth,
death:line.death,name:line.name,
biography:line.biography,
birthplace:line.birthplace})
    '''
    movie_neo4j.run(person_node_cql)

def load_movie():
    movie_node_cql = '''LOAD CSV WITH HEADERS FROM "file:///movie.csv" AS line
MERGE (p:Movie{mid:toInteger(line.mid),title:line.title,introduction:line.introduction,
rating:toFloat(line.rating),releasedate:line.releasedate})
    '''
    movie_neo4j.run(movie_node_cql)

def load_movie_person_rel():
    movie_person_rel = '''LOAD CSV WITH HEADERS FROM "file:///person_to_movie.csv" AS line
match (from:Person{pid:toInteger(line.pid)}),(to:Movie{mid:toInteger(line.mid)})
merge (from)-[r:actedin{pid:toInteger(line.pid),mid:toInteger(line.mid)}]->(to)
    '''
    movie_neo4j.run(movie_person_rel)

def load_movie_genre_rel():
    movie_genre_rel = '''LOAD CSV WITH HEADERS FROM "file:///movie_to_genre.csv" AS line
match (from:Movie{mid:toInteger(line.mid)}),(to:Genre{gid:toInteger(line.gid)})
merge (from)-[r:is{mid:toInteger(line.mid),gid:toInteger(line.gid)}]->(to)
    '''
    movie_neo4j.run(movie_genre_rel)

3 核心功能模块

前面四节我们主要是对电影问答项目涉及的知识进行了介绍，包括知识图谱的简介，图数据的使用和案例，从本节开始正式进入项目开发。首先我们要完成问答框架的搭建，在问答应用中，我们接收的是用户的自然语言问句，首先需要对自然语言问句进行解析，这里涉及到自然语言处理的一些知识，比如分词、命名实体识别，同时我们需要对问句进行分类，这里涉及到机器学习中分类相关的算法，特别是对文本的分类处理办法。在把自然语言问句进行分类之后，我们需要进行查询语句转换，把分好类的问题转换为图数据库或其他数据库的查询语言，从而在数据库中查询出我们想要的结果，最后将查询结果返回给用户，就完成了整个问答流程，具体如下图所示。

项目目录：

下面这段代码是上述流程的体现，我们把上述流程写道Service层中的QuestionService类中，在QuetionService的get_answer方法中，接受控制层传入的自然语言问句，然后调用model层的分类方法和查询语句方法，最后把结果返回给控制层。

class QuestionService:
"""
    &#x95EE;&#x7B54;&#x6838;&#x5FC3;&#x7C7B;&#xFF0C;&#x63A5;&#x53D7;&#x95EE;&#x9898;&#x8F93;&#x5165;&#xFF0C;&#x6784;&#x9020;&#x67E5;&#x8BE2;&#x8BED;&#x53E5;&#xFF0C;&#x8F93;&#x51FA;&#x67E5;&#x8BE2;&#x7ED3;&#x679C;
"""

    def __init__(self):
        print()
        self.classify_model = QuestionClassify()
        self.question_template = QuestionTemplate()

    def get_answer(self, question):
        print()
        # &#x901A;&#x8FC7;&#x5206;&#x7C7B;&#x5668;&#x83B7;&#x53D6;&#x5206;&#x7C7B;
        question_category = self.classify_model.predict(question)
        print(f"{question}&#x7684;&#x5206;&#x7C7B;&#x662F;&#xFF1A;{question_category}")
        # self.classify_model.get_question_category_desc(question_category)
        try:
            answer = self.question_template.get_question_answer(question, question_category)
        except BaseException as e:
            traceback.print_exc()
            answer = "&#x6211;&#x4E5F;&#x8FD8;&#x4E0D;&#x77E5;&#x9053;&#xFF01;"
        return answer

3.1 问题分类

朴素贝叶斯

贝叶斯思想

贝叶斯学派的思想可以概括为先验概率+数据=后验概率。

也就是说我们在实际问题中需要得到的后验概率，可以通过先验概率和数据一起综合得到。

sklearn中的朴素贝叶斯

朴素贝叶斯是一类比较简单的算法，scikit-learn中朴素贝叶斯类库的使用也比较简单。
相对于决策树，KNN之类的算法，朴素贝叶斯需要关注的参数是比较少的，这样也比较容易掌握。

GaussianNB，MultinomialNB和BernoulliNB。

GaussianNB就是先验为高斯分布的朴素贝叶斯，
MultinomialNB就是先验为多项式分布的朴素贝叶斯，
BernoulliNB就是先验为伯努利分布的朴素贝叶斯。
如果样本特征的分布大部分是连续值，使用GaussianNB会比较好。
如果如果样本特征大部分是多元离散值，使用MultinomialNB比较合适。
如果样本特征是二元离散值或者很稀疏的多元离散值，应该使用BernoulliNB。

利用朴素贝叶斯做问题匹配

构造训练数据

def load_train_data():
    train_x = []
    train_y = []
    file_path_list = file_util.get_file_list(os.path.join(constant.DATA_DIR, "question"))
    for file_item in file_path_list:
        # &#x83B7;&#x53D6;&#x6587;&#x4EF6;&#x540D;&#x4E2D;&#x7684;label
        label = re.sub(r'\D', "", file_item)
        if label.isnumeric():
            label_num = int(label)
            # &#x8BFB;&#x53D6;&#x6587;&#x4EF6;&#x5185;&#x5BB9;
            with (open(file_item, "r", encoding="utf-8")) as file:
                lines = file.readlines()
                for line in lines:
                    # &#x5206;&#x8BCD;
                    word_list = list(jieba.cut(str(line).strip()))
                    # print(word_list)
                    train_x.append(" ".join(word_list))
                    train_y.append(label_num)
    return train_x, train_y

文本向量化

利用tfidf做文本向量化

self.tfidf_vec = TfidfVectorizer()
self.train_vec = self.tfidf_vec.fit_transform(self.train_x).toarray()

训练模型

    def train_model_nb(self):
"""
        &#x5229;&#x7528;&#x6734;&#x7D20;&#x8D1D;&#x53F6;&#x65AF;&#x5206;&#x7C7B;&#x5668;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
        :return:
"""

        nb = MultinomialNB(alpha=0.01)
        nb.fit(self.train_vec, self.train_y)
        return nb

预测

    def predict(self, question):
        # &#x8BCD;&#x6027;&#x6807;&#x6CE8;
        text_cut_gen = nlp_util.posseg(question)
        # &#x83B7;&#x53D6;&#x6A21;&#x677F;
        # &#x66FF;&#x6362;nr&#xFF08;&#x4EBA;&#x540D;&#xFF09; nm&#xFF08;&#x7269;&#x54C1;&#xFF09; ng&#xFF08;&#x540D;&#x8BCD;&#x8BCD;&#x7D20;&#xFF09;
        # &#x539F;&#x59CB;&#x95EE;&#x9898;
        text_src_list = []
        # &#x4E00;&#x822C;&#x5316;&#x7684;&#x95EE;&#x9898;&#xFF0C;&#x628A;&#x4EBA;&#x540D;&#x66FF;&#x6362;&#x4E3A;nr&#xFF0C;&#x4F9D;&#x6B64;&#x7C7B;&#x63A8;
        text_normal_list = []
        for item in text_cut_gen:
            text_src_list.append(item.word)
            if item.flag in ['nr', 'nm', 'ng']:
                text_normal_list.append(item.flag)
            else:
                text_normal_list.append(item.word)
        question_normal = [" ".join(text_normal_list)]
        question_src = [" ".join(text_src_list)]

        question_vector = self.tfidf_vec.transform(question_normal).toarray()
        predict = self.model.predict(question_vector)[0]
        return predict

单元测试

def test_question_classify():
    # question = "&#x7AE0;&#x5B50;&#x6021;&#x6F14;&#x8FC7;&#x54EA;&#x4E9B;&#x7535;&#x5F71;"
    question = "&#x82F1;&#x96C4;&#x7684;&#x4E3B;&#x6F14;&#x6709;&#x8C01;"
    # question = "&#x54C8;&#x5229;&#x6CE2;&#x7279;&#x7684;&#x4E3B;&#x6F14;&#x6709;&#x8C01;"
    question_classify = QuestionClassify()
    result = question_classify.predict(question)
    print(f"{question} category:{result}")

3.2 问句解析

解析问句中的实体

 # &#x83B7;&#x53D6;&#x7535;&#x5F71;&#x540D;&#x5B57;
    def get_movie_name(self):
        ## &#x83B7;&#x53D6;nm&#x5728;&#x539F;&#x95EE;&#x9898;&#x4E2D;&#x7684;&#x4E0B;&#x6807;
        tag_index = self.question_flag.index("nm")
        ## &#x83B7;&#x53D6;&#x7535;&#x5F71;&#x540D;&#x79F0;
        movie_name = self.question_word[tag_index]
        return movie_name

    # &#x83B7;&#x53D6;&#x4EBA;&#x7269;&#x540D;&#x5B57;
    def get_name(self, type_str):
        name_count = self.question_flag.count(type_str)
        if name_count == 1:
            ## &#x83B7;&#x53D6;nm&#x5728;&#x539F;&#x95EE;&#x9898;&#x4E2D;&#x7684;&#x4E0B;&#x6807;
            tag_index = self.question_flag.index(type_str)
            ## &#x83B7;&#x53D6;&#x7535;&#x5F71;&#x540D;&#x79F0;
            name = self.question_word[tag_index]
            return name
        else:
            result_list = []
            for i, flag in enumerate(self.question_flag):
                if flag == str(type_str):
                    result_list.append(self.question_word[i])
            return result_list

    # &#x83B7;&#x53D6;&#x6570;&#x5B57;&#xFF0C;&#x5982;&#x8BC4;&#x5206;
    def get_num_x(self):
        x = re.sub(r'\D', "", "".join(self.question_word))
        return x

根据问题和模板选择相应的查询

    def get_question_answer(self, question, template_id):

        question = nlp_util.question_posseg(question)
        # &#x9884;&#x5904;&#x7406;&#x95EE;&#x9898;
        question_word, question_flag = [], []
        for one in question:
            word, flag = one.split("/")
            question_word.append(str(word).strip())
            question_flag.append(str(flag).strip())
        assert len(question_flag) == len(question_word)
        self.question_word = question_word
        self.question_flag = question_flag
        self.raw_question = question
        # &#x6839;&#x636E;&#x95EE;&#x9898;&#x6A21;&#x677F;&#x6765;&#x505A;&#x5BF9;&#x5E94;&#x7684;&#x5904;&#x7406;&#xFF0C;&#x83B7;&#x53D6;&#x7B54;&#x6848;
        answer = self.q_template_dict[template_id]()
        if len(answer) == 0:
            answer = "&#x62B1;&#x6B49;&#xFF0C;&#x6211;&#x8FD8;&#x4E0D;&#x77E5;&#x9053;&#x8FD9;&#x4E2A;&#x7B54;&#x6848;"
        return answer

构造查询类别

class QuestionTemplate():
    def __init__(self):
        self.q_template_dict = {
            0: self.get_movie_rating,
            1: self.get_movie_releasedate,
            2: self.get_movie_type,
            3: self.get_movie_introduction,
            4: self.get_movie_actor_list,
            5: self.get_actor_info,
            6: self.get_actor_act_type_movie,
            7: self.get_actor_act_movie_list,
            8: self.get_movie_rating_bigger,
            9: self.get_movie_rating_smaller,
            10: self.get_actor_movie_type,
            11: self.get_cooperation_movie_list,
            12: self.get_actor_movie_num,
            13: self.get_actor_birthday
        }

        self.neo4j_conn = Neo4jQuery()
   # 0:nm &#x8BC4;&#x5206;
    def get_movie_rating(self):

        return final_answer

    # 1:nm &#x4E0A;&#x6620;&#x65F6;&#x95F4;
    def get_movie_releasedate(self):

        return final_answer

    # 3:nm &#x7B80;&#x4ECB;
    def get_movie_introduction(self):

        return final_answer

    # 4:nm &#x6F14;&#x5458;&#x5217;&#x8868;
    def get_movie_actor_list(self):

        return final_answer

    # 6:nnt ng &#x7535;&#x5F71;&#x4F5C;&#x54C1;
    def get_actor_act_type_movie(self):

        return final_answer

    # 7:nnt &#x7535;&#x5F71;&#x4F5C;&#x54C1;
    def get_actor_act_movie_list(self):

        return final_answer

    def get_actorname_movie_list(self, actorname):

        return final_answer

    def get_movie_rating_smaller(self):

        return final_answer

    def get_cooperation_movie_list(self):

        return final_answer

    def get_actor_movie_num(self):

        return final_answer

    def get_actor_birthday(self):

        return final_answer

3.3 查询语句转换

查询语句转换

获取评分

    def get_movie_rating(self):
        # &#x83B7;&#x53D6;&#x7535;&#x5F71;&#x540D;&#x79F0;&#xFF0C;&#x8FD9;&#x4E2A;&#x662F;&#x5728;&#x539F;&#x95EE;&#x9898;&#x4E2D;&#x62BD;&#x53D6;&#x7684;
        movie_name = self.get_movie_name()
        cql = f"match (m:Movie)-[]->() where m.title='{movie_name}' return m.rating"
        print(cql)
        answer = self.neo4j_conn.run(cql)[0]
        print(answer)
        answer = round(answer, 2)
        final_answer = movie_name + "&#x7535;&#x5F71;&#x8BC4;&#x5206;&#x4E3A;" + str(answer) + "&#x5206;&#xFF01;"
        return final_answer

获取上映时间

    def get_movie_releasedate(self):
        movie_name = self.get_movie_name()
        cql = f"match(m:Movie)-[]->() where m.title='{movie_name}' return m.releasedate"
        print(cql)
        answer = self.neo4j_conn.run(cql)[0]
        final_answer = movie_name + "&#x7684;&#x4E0A;&#x6620;&#x65F6;&#x95F4;&#x662F;" + str(answer) + "&#xFF01;"
        return final_answer

获取电影类型

    def get_movie_type(self):
        movie_name = self.get_movie_name()
        cql = f"match(m:Movie)-[r:is]->(b) where m.title='{movie_name}' return b.name"
        print(cql)
        answer = self.neo4j_conn.run(cql)
        answer_set = set(answer)
        answer_list = list(answer_set)
        answer = "&#x3001;".join(answer_list)
        final_answer = movie_name + "&#x662F;" + str(answer) + "&#x7B49;&#x7C7B;&#x578B;&#x7684;&#x7535;&#x5F71;&#xFF01;"
        return final_answer

获取电影介绍

    def get_movie_introduction(self):
        movie_name = self.get_movie_name()
        cql = f"match(m:Movie)-[]->() where m.title='{movie_name}' return m.introduction"
        print(cql)
        answer = self.neo4j_conn.run(cql)[0]
        final_answer = movie_name + "&#x4E3B;&#x8981;&#x8BB2;&#x8FF0;&#x4E86;" + str(answer) + "&#xFF01;"
        return final_answer

获取演员列表

获取演员介绍

获取演员演过的指定类型的电影列表

获取演员演过的电影列表

获取演员演过的评分大于特定分值的电影列表

获取演员演过的评分小于特定分值的电影列表

获取演员演过电影的所有类型

获取演员的合作演员

获取演员演过的电影数量

获取演员的生日

Original: https://blog.csdn.net/weixin_38082579/article/details/125389322
Author: weixin_38082579
Title: 知识图谱推荐之neo4j电影智能问答项目

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557482/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习笔记 – 时间序列的季节性

一、季节性只要序列的平均值有规律的、周期性的变化，时间序列就会表现出季节性。季节性变化通常遵循时钟和日历——一天、一周或一年的重复很常见。季节性通常是由自然世界在几天和几年内…

人工智能 2023年6月15日
0090
STATA分数多项式回归

分数多项式模型应用：当怀疑连续性自变量与因变量的某些或全部关系可能是非线性的时。可以基于线性模型、logistic回归、cox回归。 1、基于线性模型： fp scale cen…

人工智能 2023年6月17日
00119
图像基本处理(灰度化)

项目场景：今天我们开始最基础的图像处理，将一张图片进行灰度化处理。我们将使用OpenCV来进行图像的处理基础知识图片主要包含以下内容：1.像素，也就是我们通常说的RGB模型，…

人工智能 2023年5月26日
0084
《游戏数据分析实战》总结&思考

对于一个游戏行业的门外汉，这本书对于了解游戏业务具有很强的指导性，通过大量的案例说明了游戏这一具有特殊行业逻辑的行业，如何针对性地进行数据分析。一、游戏关键数据指标 1、转化率—…

人工智能 2023年7月15日
0051
迁移学习-如何使用预训练权重，冻结部分层权重训练

迁移学习在计算机视觉领域中是一种很流行的方法，因为它可以建立精确的模型，耗时更短。利用迁移学习，不是从零开始学习，而是从之前解决各种问题时学到的模式开始。这样，我们就可以利用以前的…

人工智能 2023年6月24日
0077
win10+RTX3050ti+TensorFlow+cudn+cudnn配置深度学习环境

避坑1：RTX30系列显卡不支持cuda11.0以下版本，具体上限版本可自行查阅：方法一，在cmd中输入nvidia-smi查看方法二：由此可以看出本电脑最高适配cuda11…

人工智能 2023年5月23日
0088
【信号识别】基于matlab深度学习CNN信号调制分类【含Matlab源码 2066期】

⛄一、深度学习CNN信号调制分类概述 1 背景介绍在通信信号处理领域, 特别是在非协作通信信号盲解调研究领域, 每时隙突发信号的调制方式不同, 必须进行信号的调制方式自动识别。信号…

人工智能 2023年6月16日
00121
yolov5模型原理及代码流程讲解（v6.1）

1.前言对于yolov5一直在更新优化，这个自然不用多说，在目标检测领域占有量很大；所以写一下相关原理及代码方面的笔记也是有意义的对于自己和想了解yolov5的小伙伴。 2.模型…

人工智能 2023年6月23日
0082
猿创征文｜Python-sklearn机器学习之旅：我的第一个机器学习实战项目

[二、 _征文_内容1、本次 _征文_活动以”仁爱久和·敬业求精”为主题，要求结合工作实际，充分表达我院的精神风貌,表达作为”久和”…

人工智能 2023年6月16日
0042
keras.losses中from_logits的作用

以 SparseCategoricalCrossentropy(from_logits=True) 为例，读keras源码，发现 losses.py 中定义的 SparseCate…

人工智能 2023年5月23日
0083
21句话入门机器学习

这是一篇关于机器学习工具包Scikit-learn的入门级读物。对于程序员来说，机器学习的重要性毋庸赘言。也许你还没有开始，也许曾经失败过，都没有关系，你将在这里找到或者重拾自信。…

人工智能 2023年5月31日
0091
1-基于ArUco码的标记与检测

1-简介姿态估计（Pose estimation）在计算机视觉领域扮演着十分重要的角色：机器人导航、增强现实以及其它。这一过程的基础是找到现实世界和图像投影之间的对应点。…

人工智能 2023年7月19日
0060
基于Keras实战项目-猫狗熊猫分类大战

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉深度学…

人工智能 2023年7月3日
00118
PyCharm 这40个使用技巧真棒

大家好，今天分享 PyCharm 40个使用技巧，欢迎收藏、分享、点赞。废话不多说。我们开始吧！第一章：运行调试篇 1. 通过指定参数，执行程序你在 Pycharm 运行你的…

人工智能 2023年7月4日
00104
PyTorch——自注意力（self-attention）机制实现（代码详解）

参考链接 https://www.bilibili.com/video/BV1JE411g7XF?p=54 https://arxiv.org/abs/1706.03762 htt…

人工智能 2023年6月17日
0059
【深度强化学习】多智能体算法汇总

0 Preliminaries 在多智能体强化学习算法中，两个主要的技术指标为合理性与收敛性。合理性（rationality）：在对手使用一个恒定策略的情况下，当前智能体能够学习…

人工智能 2023年7月27日
0036

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31