基于apache-jena的知识问答

2023年6月1日上午5:28 • 人工智能 • 阅读 86

前言
这篇文章主要写如何使用Python对apache-jena进行交互查询。具体三元组数据建立、转换、导入内容请看：知识问答三元组数据准备阶段。本文在知识问答三元组数据准备阶段的基础上，接着往下写。
注：本文案例代码使用 https://github.com/zhangtao-seu/Jay_KG 中的代码

一、代码目录结构

下图为Jay_KG项目的代码目录结构。其中重要的是query_main.py和question_temp.py文件，其中前者为程序主入口，后者为知识问答模板的定义。

二、知识问答实现

2.1、三元组数据获取

本文案例使用potege软件建模，最后导出owl文件，后继续根据知识问答三元组数据准备阶段文中的2.2小节内容一步一步做。本案例使用potege建模后如下图所示

2.1、定义实体

在Jay_KG/KB_query/external_dict中有一个sanguo.txt，这就是博主定义的实体文件，内容如下图所示

2.2、定义问题模板

打开 question_temp.py文件，定义模板，如下代码所示，QuestionSet类下的o_name、rides函数定义了关羽字（别名、小名）是什么？被、和关羽的坐骑（骑、战马）是什么？两个模板。

encoding=utf-8

"""
@desc:
设置问题模板，为每个模板设置对应的SPARQL语句。demo提供如下模板：

"""
from refo import finditer, Predicate, Star, Any, Disjunction
import re

# TODO SPARQL前缀和模板
SPARQL_PREXIX = u"""
PREFIX owl:
PREFIX rdfs:
PREFIX xsd:
PREFIX :
"""

SPARQL_PREXIX = u"""
PREFIX owl:
PREFIX rdfs:
PREFIX xsd:
PREFIX :
"""

SPARQL_SELECT_TEM = u"{prefix}\n" + \
             u"SELECT {select} WHERE {{\n" + \
             u"{expression}\n" + \
             u"}}\n"

class W(Predicate):
    def __init__(self, token=".*", pos=".*"):
        self.token = re.compile(token + "$")
        self.pos = re.compile(pos + "$")
        super(W, self).__init__(self.match)

    def match(self, word):
        m1 = self.token.match(word.token.decode("utf-8"))
        m2 = self.pos.match(word.pos)
        return m1 and m2

class Rule(object):
    def __init__(self, condition_num, condition=None, action=None):
        assert condition and action
        self.condition = condition
        self.action = action
        self.condition_num = condition_num
    #                 word_object  :   [词，词性]
    def apply1(self, sentence):
        matches = []
        #                      【person_entity】
        for m in finditer(self.condition, sentence):
            i, j = m.span()
            matches.extend(sentence[i:j])

        return self.action(matches), self.condition_num

class QuestionSet:
    def __init__(self):
        pass

    @staticmethod
    def o_name(word_object):
        #关羽字什么?

        select = u"?o"
        sparql = None

        for w in word_object:
            if w.pos == pos_person:
                e = u" :{person} :字 ?o.".format(person=w.token.decode('utf-8'))
            sparql = SPARQL_SELECT_TEM.format(prefix=SPARQL_PREXIX,
                                              select=select,
                                              expression=e)
            print(sparql)
            break
        return sparql

    @staticmethod
    def rides(word_object):
        #关羽战马是什么?

        select = u"?o"
        sparql = None

        for w in word_object:
            if w.pos == pos_person:
                e = u" :{person} :骑 ?o.".format(person=w.token.decode('utf-8'))
            sparql = SPARQL_SELECT_TEM.format(prefix=SPARQL_PREXIX,
                                              select=select,
                                              expression=e)
            print(sparql)
            break
        return sparql

TODO 定义关键词
pos_person = "nr"
person_entity = (W(pos=pos_person))

other_name = (W("字") | W("别名") | W("小名"))
ride = (W("骑") | W("坐骑") | W("战马"))

TODO 问题模板/匹配规则
"""

关羽字什么？
关羽的战马是什么？

"""

rules = [
    # 关羽字什么？
    Rule(condition_num=0, condition=person_entity + Star(Any(), greedy=False) + other_name + Star(Any(), greedy=False), action=QuestionSet.o_name),
    Rule(condition_num=0, condition=person_entity + Star(Any(), greedy=False) + ride + Star(Any(), greedy=False), action=QuestionSet.rides),

]

三、运行代码进行问答

进入query_main文件运行，后在控制台输入之前定义好的模板，即可收到返回。

Original: https://blog.csdn.net/zkkkkkkkkkkkkk/article/details/123801304
Author: zkkkkkkkkkkkkk
Title: 基于apache-jena的知识问答

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/554975/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【中级计量经济学】Lecture 8 虚拟变量回归

Lecture 8 虚拟变量回归虚拟变量陷阱：实质是完全多重共线性结构变化分析交互效应分析交互项： C = α + β Y + u C=\alpha+\beta Y+u C…

人工智能 2023年6月18日
00107
【BP预测】基于BP神经网络实现房价预测附matlab代码

1 简介在人工神经网络的实际应用中, 大多数的人工神经网络模型是采用前馈反向传播网络 ( Back- Propagation Net work , 简称 BP网络 )或它的变化形…

人工智能 2023年7月14日
0086
【kaggle竞赛】Ames房价预测与回归问题（上）

2021.9.17 自学机器学习的日子，在图书馆摸了本《大数据与机器学习经典案例》，记录一下。第一章，讲讲房价预测和回归问题。本文用到的是爱荷华州艾姆斯市房价数据集，由杜…

人工智能 2023年6月19日
0065
tianchi电商搜索competition

文章目录 tianchi电商搜索competition * 一、环境配置&实践数据下载二、解决方法 – 2.1 tf-idf 2.2 dssm tianchi…

人工智能 2023年5月31日
0064
Convolutional网络中的池化层是什么？它对于图像处理有什么影响

问题背景在深度学习领域，卷积神经网络（Convolutional Neural Network, CNN）是一种用于处理具有类似网格结构的数据（如图像和语音）的人工神经网络。CN…

人工智能 2024年1月3日
0036
雷达成像 Matlab 仿真 3 —— 多目标检测

文章目录 1. 多目标信号的回波 * 1.1 参数设置 1.2 生成回波信号 2. 脉冲压缩 * 2.1 未加窗 2.2 加 hann 窗 3. 绘制图像脉冲压缩能够将信号压缩变…

人工智能 2023年6月17日
0079
ISP—自动白平衡（AWB)

定义与原理： AWB指的是自动白平衡，即Auto White Balance的缩略。基本原理是任意环境下，把白色物体的还原成白色物体。 AWB在图像处理的过程中自动的移除由于光源亮…

人工智能 2023年6月20日
0060
kaldi-tdnn模型训练策略-pytorch实现

relu：RectifiedLinearComponent self-repair-scale=1e-05affine：NaturalGradientAffineComponent…

人工智能 2023年5月23日
0077
matlab图像绘制（四）散点图绘制

1.1二维散点图 scatter函数例一： x=[12,14,16,21,23,25,27,19,23,21]y=[78,79,69,74,71,82,68,85,83,81]s…

人工智能 2023年6月17日
0065
二、Go基础语法

Go基础语法 1、行分隔符代码示例 package main import "fmt" func main() { fmt.Println("Hel…

人工智能 2023年6月28日
0070
python-opencv第二期：imwrite函数详解

概要：众嗦粥之所周知，在如今计算机视觉（ Computer Version short for CV）是人工智能与机器人技术发展的一个重大研究方向，而 opencv作为一个专门为计…

人工智能 2023年6月24日
0067
MMdet的Resnet卷积替换成Ghost卷积组所出现的问题

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月18日
0066
猿创征文｜时间序列分析算法之二次指数平滑法和三次指数平滑法详解+Python代码实现

二次指数平滑法(Holt’s linear trend method) 1.定义 2.公式二次指数平滑值： Original: https://blog.csdn.n…

人工智能 2023年7月28日
0049
半监督学习算法如何利用未标记的数据

问题概述半监督学习算法是一种可以利用未标记数据来提升机器学习模型性能的方法。本文将详细介绍半监督学习算法如何利用未标记数据。我们将围绕算法原理、公式推导、计算步骤以及复杂Pyth…

人工智能 2024年1月1日
0022
pandas-Dataframe(取数)

DataFrame DataFrame是什么 DataFrame的常用API DataFrame局部数据的API(取数) * loc 和iloc(重要) – 功能: 区…

人工智能 2023年7月6日
0064
【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍

【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍文章目录【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍 * 一、Gaz…

人工智能 2023年6月23日
0077

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于apache-jena的知识问答

一、代码目录结构

二、知识问答实现

2.1、三元组数据获取

2.1、定义实体

2.2、定义问题模板

三、运行代码进行问答

大家都在看