Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

2023年6月1日上午9:16 • 人工智能 • 阅读 74

Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

现有模型存在的问题
Contribution
问题定义
*
Graph Representation and Encoding
Planning Creation and Encoding
Decoding
Experiments
Experiments on Text Generation
Future Work

现有模型存在的问题

在生成过程中融合结构信息，将sequential encoder替换为graph encoder，例如GCN,导致Graph2Seq模型在某些任务上比Seq2Seq出色，不过这种结构增加了encoder和decoder之间的结构差异。这种结构差异增加了在source和target之间对齐的难度,对齐即生成文本和图结构上文本的对应关系。在机器翻译过程中，pre-reordering the soure words有助于提高翻译质量。

Contribution

提出一种双编码模型来缩小结构化图和非结构文本之间的结构上的差距。
提出一种 neural planner
实现显示我们的方法比所有baseline都出色

问题定义

给出RDF数据 N-triples，根据给出的三元组输出一段描述该图中事实的自然语言文本。

Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

Dual Encoding Model
1.捕获图结构信息采用GCN encoder
2.plan encoder促使输入输出之间的信息对齐：应用于另一个GCN，序列化并重新排列图中的node作为一个中间plan，然后将这个plan传入LSTM encoder。

最后用一个LSTM decoder 综合两个encoder的上下文表示，生成输出文本。其中，graph和plan都是相同数据的不同表示，对他们进行两次独立的编码，为decoder提供互补信息。

; Graph Representation and Encoding

改变图的结构，将entities和predicates作为node，s和o通过entity mentions辨别，p通过ID辨别。
相同提及的两个entity，即使来自不同的triples，也作为相同的node。想利用predicates来区分不同的triples，
两个相同提及的predicates也作为不同的node。

重新定义了七种edge
s->p p->s
o->p p->o
s，p，o的三种self-loop n->n

在建立图之后，利用R-GCN编码

Planning Creation and Encoding

目的：弥补结构性图和非结构性文本之间的差距，输出结果与谓词的顺序有关。
首先利用RGCN的encoder来获取每个node的表示。然而，在获取谓词的表示时为输入特征X额外附加两位。其中一个表示当前predicates是否被访问，另一个表示是否最后一个也被访问完。

plan生成作为顺序决策过程，将选择谓词作为分类任务。每一次选择后修改附加两位的值，通过GCN计算表示，是在剩余未访问的谓词中选择。

在决定了输入predicates的顺序后，我们通过添加对应的subject和object完成plan。为了获取更好的语义角色信息，区分subject/predicate/object，在S,P,O之前都添加分隔符。最后用LSTM进行编码plan，LSTM捕获序列信息。

; Decoding

an LSTM-based decoder with an attention and copy mechanism

定义了两种decoder策略输入上下文
PLANENC：only use hidden states of the plan encoder as context .
DUALENC: to incorporate the information from both the graph and the plan.

DUALENC:

Experiments

对Planner和总体生成系统进行评估。

DataSet：WebNLG
对于每一个样本，输入为N-triples from DBPedia，最多到达7个。输出是对三元组展示的文本描述。每一个三元组集还配有人工生成的参考文本，最多达到三个。参考文本和它实现的三元组顺序对应。用于训练和评估Planner。

总体数据集包含9674个三元组集合，25298个参考文本。测试集中包含两个子集，Seen指训练时模型使用过的，Unseen指训练时模型未使用过的，用来评估模型的泛化能力。

; Experiments on Text Generation

测试模型提高生成质量的能力

指标：BLEU,METEOR,TER
PLANENC与DUALENC表现相当，我们采用人工评价去进一步比较。

结论：
plan的准确性对生成质量至关重要。
copy机制从三元组中复制token，是有助于效果提升的。
entity mention信息能够有助于缓解数据的稀疏性并与复制机制协调。
移除delimiters影响不大。

Absolute判断三元组是否被生成文本覆盖或生成文本与原三元组一致。
pairwise是将DualEnc生成文本与其他模型生成的文本进行比较。

Future Work

本文中plan部分仅考虑三元组顺序，未来工作可以探索subject和object的顺序。
未来工作可以验证该方法在其他data-to-text生成任务的有效性。

Original: https://blog.csdn.net/qq_41894414/article/details/122761584
Author: Terra-incognito
Title: Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556031/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【定量分析、量化金融与统计学】纵向数据分析（1）——截面数据、时间序列数据和纵向数据

一、截面数据（Cross-sectional Data）截面数据就是固定时间来分析其他变量同一时间内的关系。例如：比较2022年的全国20个省市的GDP与人口，那么我们就是限定…

人工智能 2023年6月19日
0063
Go语言学习之路（二）

Go语言学习之路（二）面对对象编程思想 * 抽象封装继承接口文件命令行参数 Json * 序列化反序列化（unmarshal）单元测试 Redis * Redis简…

人工智能 2023年5月30日
00118
对于代码复现学习的一些理解||计算机研究生学习笔记||经验分享||深度学习||pytorch||不定期长期更新

代码复习对于初学者，一开始接触深度学习代码总是困难的，尤其是对于github上满屏英文、复杂的环境、各种各样的报错，有时候哪怕跟着配套的readme、论文、视频，仍然不能成功跑起…

人工智能 2023年5月28日
0084
语音增强、识别、评测常用噪声库、数据集

NoiseX-92 White noise Pink noise HF channel noise Speech babble Factory floor noise 1 Fact…

人工智能 2023年5月25日
0061
语音识别研究方向

远场语音识别1）语音激活检测（VAD）需求背景：在近场识别场景，比如使用语音输入法时，用户可以用手按着语音按键说话，结束之后松开，由于近场情况下信噪比（signal to noi…

人工智能 2023年5月25日
0058
uie模型微调个人总结

技巧：六月三十号补充，uie处理3000字的政策文件要占用12G左右的内存，uie处理一万字的文件时运行巅峰要占用28G左右内存，各位部署时，注意out of memory的错误…

人工智能 2023年6月30日
0084
BERT模型—2.BERT模型预训练与微调

文章目录 * – + 引言 + 一、预训练语言模型 + * 1.为什么要进行预训练？ * 2. BERT预训练-掩码预测任务 * 3.BERT预训练-下句预测任务 + …

人工智能 2023年5月31日
0090
机器学习强基计划0-4：通俗理解奥卡姆剃刀与没有免费午餐定理

目录 0 写在前面 1 奥卡姆剃刀原则 2 天下没有免费的午餐 3 丑小鸭定理 ; 0 写在前面机器学习强基计划聚焦深度和广度，加深对机器学习模型的理解与应用。”深&…

人工智能 2023年6月19日
0072
COOtBu-PEG-amine，NH2-PEG-COOtBu，叔丁酯-PEG-氨基试剂供应

氨基-聚乙二醇-叔丁酯是一种线性杂双功能PEG试剂，其化学试剂其英文名为COOtBu-PEG-amine（NH2-PEG-COOtBu），它所属分类为Amine PEG。其试剂分…

人工智能 2023年6月30日
0073
动漫风格化—AnimeGANv2

animegan2_face2paint_v2bryandlee/naver-webtoon-faces AnimeGANv2 项目 [Project]AnimeGANv2 ; 摘…

人工智能 2023年5月28日
00121
【神经网络】(13) ShuffleNetV2 代码复现，网络解析，附Tensorflow完整代码

各位同学好，今天和大家分享一下如何使用 Tensorflow复现轻量化神经网络 ShuffleNetV2。为了能将神经网络模型用于移动端（手机）和终端（安防监控、无人驾驶）的实…

人工智能 2023年5月24日
0053
DataFrame

在Spark SQL中有两种方式可以在DataFrame和RDD进行转换首先在maven项目的pom.xml中添加Spark SQL的依赖 <dependency> …

人工智能 2023年6月2日
0069
数据挖掘 | 实验二数据的可视化

文章目录一、目的与要求二、实验设备与环境、数据三、实验内容 * （1）数据获取（2）数据的清理（3）可视化技术 – a) 直方图展示各个维度的值分布情况；（2…

人工智能 2023年6月11日
0075
KITTI数据集及标定文件介绍（详细）

KITTI数据集介绍 Kitti数据集是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据，每张图像中最多达15辆…

人工智能 2023年6月10日
00188
利用sklearn对红酒数据集分类

sklearn介绍 scikit-learn, 又写作sklearn, 是一个开源的基于python语言的机器学习工具包. 它通过numpy, Scipy和 Matplotlib等…

人工智能 2023年7月1日
0091
利用LSTM实现预测时间序列（股票预测）

目录 1. 作者介绍 2. tushare 简介 3. LSTM简介 * 3.1 循环神经网络 (Recurrent Neural Networks) 3.2 LSTM网络 &#8…

人工智能 2023年7月12日
0055

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

Bridging the Structural Gap Between Encoding and Decoding for Data-To-Text Generation

; Graph Representation and Encoding

Planning Creation and Encoding

; Decoding

Experiments

; Experiments on Text Generation

Future Work

大家都在看