论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

introduction

  1. 将对话行为预测看做和响应生成一样的序列生成任务

  2. 同时训练对话行为和响应的生成模型

  3. 损失函数使用不确定性损失,自适应调整响应生成和对话行为生成的权重

method

对话行为生成:将对话行为按照领域-意图-槽值三级结构组织,对每个token进行编码

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

其中Vb是belief state,随后Ha按照如下decoder的步骤生成

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

此处有疑惑,论文中说按照decoder的步骤生成Ha,但是decoder中没有H的生成公式,只有encoder中有H的生成方式,所以是这里笔误吗,此处存疑,需阅读代码解惑。下为encoder的公式,F为一个transformer的结构:

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

其次是响应的生成:

首先需要对话行为的指导,也就是一个动态行为注意力层:

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

接下来生成响应的每个token:

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

不确定性损失和自适应权重:

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

Experiments

数据集:MultiWOZ

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

人类评估结果,我觉得是为了挽救BLEU分数不够高所做的实验

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

消融实验:

对话行为预测使用序列预测还是分类的消融实验

联合训练和分开训练的消融实验

不确定性损失的消融实验

总而言之,这篇论文的创新点很明显,将标签当做语言序列生成,二者联合训练。这是一个可以学习的点。模型部分不是很难,transformer加上一个注意力,但是损失函数的设计包括实验部分做的很完整,无可指摘,有许多值得学习借鉴的地方。

Original: https://blog.csdn.net/weixin_44763402/article/details/123644947
Author: 我和同桌正在写代码
Title: 论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/530027/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球