基于模板的知识问答方法

2023年6月4日下午3:16 • 人工智能 • 阅读 94

文章目录

TBSL架构
*
step1:模板生成
step2:模板匹配与实例化
step3:排序打分
TBSL的主要缺点
自动生成模板
*
QUINT架构
step1:模板的定义与生成
step2:模板的匹配和实例化
step3:排序
step4：复杂问题处理
实验结果
方法的主要贡献点
模板方法的优缺点

基于模板的方法包含模板定义、模板生成，模板匹配三大部分。
论文：TBSL(Unger et al.2012)。

TBSL架构

; step1:模板生成

模板生成大致分为如下四个步骤：

获取自然语言问题的POS 标记信息
基于POS 标记、语法规则表示问句
利用领域相关或领域无关词汇辅助解决问题
最后将语义表示转化为一个SPARQL 模板

示例：who produced the most films?

step2:模板匹配与实例化

有了SPARQL模板以后,需要进行实例化与具体的自然语言 问句相匹配。即将自然语言问句与知识库中的本体概念相映射的过程。

对于resource 和 class实体识别，用WordNet 定义知识库中标签常用方法或计算字符串相似度。对于property标签，将还需要与存储在BOA 模式库中的自然语言进行比较，最高排位的实体将作为填充查询槽位的候选答案。

示例：who produced the most films?

; step3:排序打分

步骤:

首先每个entity 根据 string similarity 和 prominence 获得一个打分。
一个query模板的分值根据填充slots 的多个entities 的平均打分。
检查type 类型。
对于全部的查询集和，仅返回打分最高的。

示例：who produced the most films?

TBSL的主要缺点

创建的模板未必和知识图谱中的数据建模相契合
考虑到数据建模的各种可能性，对应到一个问题的潜在模板数量会非常多，同时手工准备海量模板的代价也非常大。

自动生成模板

QUINT架构

能够根据utterance- answer对，根据 依存树自动学习utterance-query模板
利用自然语言的组成特点，可以使用从 简单问题中学到的模板来解决 *复杂问题

; step1:模板的定义与生成

定义一个三元组的模板:(ut,qt,mt):其中
ut为问题模板
qt为query模板
mt为问题和query映射方法模板

step2:模板的匹配和实例化

对于新问题进行依存分析，并使用工具S-MART进行NERL (freebase)
去模板库中进行匹配(u’中加粗的黑线与ut,匹配，使用子图同构匹配)
再使用词典L对mt, (mt为utterance和query对齐关系)进行实例化

; step3:排序

从问题产生多个候选query的原因
模板可能匹配多个
NER L
使用Random Forest进行学习两个query对之间的顺序

step4：复杂问题处理

; 实验结果

方法的主要贡献点

提出了QUINT能够根据utterance-answer pair,使用 依存树自动学习utterance-query模板。模板的学习使用 远程监督的方法。模板支持自动识别问题答案的类型
利用自然语言的组成特点，可以使用从简单问题中学到的模板来解决复杂问题(多个predicate)复杂问题解决流程:
将问题分解为子句
使用模板回答每一个子句
结合子句答案获取最终答案

模板方法的优缺点

优点:

模板查询响应速度快
准确率较高，可以回答相对复杂的 复合问题

缺点:
3. 人工定义的模板结构经常无法与真实的用户问
题进行匹配。
4. 如果为了尽可能匹配上一个问题的多种不同表述,则需要建立庞大的模板库， 耗时耗力且查询起来效率降低。

参考资料：王昊奋知识图谱教程

Original: https://blog.csdn.net/qq_37953072/article/details/109205404
Author: ling….
Title: 基于模板的知识问答方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568723/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NER中的一些编码器与解码器

文章目录参考编码 * LR-CNN FLAT Lex-BERT 解码 * GlobalPointer 本篇文章是命名实体识别（NER）算法的进一步介绍，主要内容是介绍一些编码器…

人工智能 2023年5月31日
00293
OpenCV实践小项目(一): 信用卡数字识别

1. 写在前面今天整理一个OpenCV实践的小项目，前几天整理了一篇OpenCV处理图像的知识笔记，后面，就通过一些小项目把这些知识运用到实践中去，一个是加深理解，另一个是融会…

人工智能 2023年6月21日
00103
传智健康_第5章预约管理-预约设置

传智健康_第5章预约管理-预约设置文章目录传智健康_第5章预约管理-预约设置第5章预约管理-预约设置 * 1. 需求分析 2. Apache POI – 2…

人工智能 2023年6月26日
00157
基于深度学习的人脸表情识别实现

1. 前言关于人脸识别，其实我一直以来做过蛮多的项目，有些是整理出帖子了，有些是没有整理出，因为学业比较繁重，所以也是断断续续的来整理。最近刚好是五一假期，也出不去，就想着来整理…

人工智能 2023年6月17日
00133
Pandas学习笔记（4) Grouping and Sorting

1.Who are the most common wine reviewers in the dataset? Create a Series whose index is th…

人工智能 2023年7月18日
0075
多项式概率分布（Multinomial probability distribution）和分类分布（categorical distribution）

文章目录 * – + 多项式概率分布 + 分类分布多项式概率分布其由二项分布推广而来，从而更加普遍。所以我们先回顾一下二项分布。二项分布的典型例子是扔硬币，设硬币…

人工智能 2023年7月2日
00101
pytorch构建的深度学习模型（pt文件）转换为onnx格式，并支持batch输入，以bert模型为例

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月27日
0095
Palantir Gotham初探

一、产品概述美国Palantir技术公司是由位于硅谷的Paypal在线支付公司和斯坦福大学计算机专家于2004年创建的。Palantir是一个商品化的情报可视化分析平台，其第一款…

人工智能 2023年6月1日
0091
将COCO格式的数据集转换为VOC（以HRSID和SSDD数据集为例）

本文主要参考博客HRSID舰船检测数据集标签格式转换，json转为xml，在其代码基础上加入大量理解性注释、对其中个别代码进行修改，并在后面附加了json文件中提取信息写成VOC格…

人工智能 2023年6月25日
00105
【计算机视觉基础】最大核聚类，采用Canny等边缘滤波方法对图像边缘提取，提取图像的Harris角点特征并进行沃罗诺伊与德劳内网格划分，显示沃罗诺伊划分的最大核聚类，详细的最大核聚类计算算法

问题描述如下：分别采用Sobel、Prewitt、Canny边缘滤波方法对一张彩色进行边缘特征提取，并分别显示对应的边缘图像，获取要求1中彩色图像上的Harris角点特征，基于…

人工智能 2023年6月2日
0095
pandas计数函数：value_counts( )和counts( )的使用

介绍一下如何在python里使用value_counts( )和counts( )进行计数。一、counts( )函数 1、count()在字符串里的使用函数体及主要参数： c…

人工智能 2023年7月14日
0080
点餐系统数据库设计–SQL Server

目录友情链接 * 1、学生成绩管理系统数据库设计–MySQL 2、医疗信息管理系统数据库–MySQL 3、邮件管理数据库设计–MySQL 4、…

人工智能 2023年7月30日
0075
【pointNet】基于pointNet的三维点云目标分类识别matlab仿真

1.软件版本 matlab2021a 2.系统概述这里，采用的pointnet网络结构如下图所示：在整体网络结构中，首先进行set abstraction，这一部分主要即对点…

人工智能 2023年7月1日
00102
PyTorch QAT（量化感知训练）实践——基础篇

Mapping function The mapping function is a function that maps values from floating-point t…

人工智能 2023年7月22日
0099
2022-2028全球与中国工业风机市场现状及未来发展趋势

【报告篇幅】：120【报告图表数】：160【报告出版时间】：2021年12月报告摘要根据简乐尚博的统计及预测，2021年全球工业风机市场销售额达到了75亿美元，预计2028年将…

人工智能 2023年6月11日
0075
15拆解_年度报告：15大品牌16款颈挂式蓝牙耳机拆解汇总

3年来我爱音频网持续深耕于消费类音频产品的研究、分析、拆解，经过长时间的积累，也为大家带来了众多传阅度非常广泛的音频行业分析、产品评测、拆解报告。 2020年已经来临，在这个关键时…

人工智能 2023年5月27日
00112

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于模板的知识问答方法

文章目录

; step1:模板生成

step2:模板匹配与实例化

; step3:排序打分

TBSL的主要缺点

QUINT架构

; step1:模板的定义与生成

step2:模板的匹配和实例化

; step3:排序

step4：复杂问题处理

; 实验结果

方法的主要贡献点

大家都在看