论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

2023年5月28日上午5:38 • 人工智能 • 阅读 79

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

introduction

将对话行为预测看做和响应生成一样的序列生成任务
同时训练对话行为和响应的生成模型
损失函数使用不确定性损失，自适应调整响应生成和对话行为生成的权重

method

对话行为生成：将对话行为按照领域-意图-槽值三级结构组织，对每个token进行编码

其中Vb是belief state，随后Ha按照如下decoder的步骤生成

此处有疑惑，论文中说按照decoder的步骤生成Ha，但是decoder中没有H的生成公式，只有encoder中有H的生成方式，所以是这里笔误吗，此处存疑，需阅读代码解惑。下为encoder的公式，F为一个transformer的结构：

其次是响应的生成：

首先需要对话行为的指导，也就是一个动态行为注意力层：

接下来生成响应的每个token：

不确定性损失和自适应权重：

Experiments

数据集：MultiWOZ

人类评估结果，我觉得是为了挽救BLEU分数不够高所做的实验

消融实验：

对话行为预测使用序列预测还是分类的消融实验

联合训练和分开训练的消融实验

不确定性损失的消融实验

总而言之，这篇论文的创新点很明显，将标签当做语言序列生成，二者联合训练。这是一个可以学习的点。模型部分不是很难，transformer加上一个注意力，但是损失函数的设计包括实验部分做的很完整，无可指摘，有许多值得学习借鉴的地方。

Original: https://blog.csdn.net/weixin_44763402/article/details/123644947
Author: 我和同桌正在写代码
Title: 论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530027/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python深度学习之残差网络ResNets

文章目录 * – 1、什么是ResNets – 2、构建一个ResNet（50层） – + 2.1 identity block + 2.2 c…

人工智能 2023年7月13日
0060
CartPole 强化学习详解1 – DQN

工作中常会接触到强化学习的内容，自己以gym环境中的Cartpole为例动手实现一下，记录点实现细节。环境：python = 3.6.13； pytorch = 1.10.2 目录…

人工智能 2023年7月21日
0070
常用27个图表的特点及用途

柱形图： (1)能够使人们一眼看出各个数据的大小。 (2)易于比较数据之间的差别。 (3)能清楚的表示出数量的多少。适用于二维数据，一个维度数据进行比较、数据单纯性展示、排序数据…

人工智能 2023年6月19日
0067
【Windows配置三】Python3.6安装rosbag

以下所以命令，均需在激活 anaconda 环境下进行安装 conda activate [your anaconda] conda activate pytorch pip in…

人工智能 2023年6月19日
0049
时间序列模型进行预测及异常值检测

文章目录前言 1. 简介 2. 步骤 3. 代码 4. 结果图展示 5. 参考资料及数据文件获取前言本文主要记录使用时间序列模型进行预测及异常值检测的相关笔记简介在数据分…

人工智能 2023年7月16日
0072
平滑降噪与边缘增强

对采集的图像进行平滑滤波或者边缘增强属于图像预处理的范畴，目的是位后续的内容的特征提取、识别等提供更好的源数据平滑降噪边缘增强 ; 卷积首先明确一点，在对图像进行处理时，由于是…

人工智能 2023年6月18日
0077
Python 毕设精品实战案例——快速索引目录

信贷业务又称为信贷资产或贷款业务，是商业银行最重要的资产业务，通过放款收回本金和利息，扣除成本后获得利润，所以信贷是商业银行的主要赢利手段。信用风险是金融监管机构重点关注的风险，关…

人工智能 2023年6月19日
0087
卷积神经网络 —— 图像卷积

卷积神经网络是最具代表性的深度学习算法之一，目前已经被大范围的应用与计算机视觉等领域，并且取得了众多突破性的进展，在学习卷积神经网络之前，我们需要学习图像卷积运算。图像卷积运算的…

人工智能 2023年6月17日
00103
对抗攻击（Adversarial Attack）

文章目录对抗攻击对抗防御对抗攻击图片可以看成一个很长的向量，如果在图片的每个像素上都加上一个很小的pertubation(扰动、杂讯)，再把它输入到神经网络，这个时候分类器…

人工智能 2023年5月26日
0064
Spring Security整体架构之认证和授权

本文内容来自王松老师的《深入浅出Spring Security》，自己在学习的时候为了加深理解顺手抄录的，有时候还会写一些自己的想法。在具体学习Spring Security各种…

人工智能 2023年6月26日
0090
python groupby填充缺失值_然后Pandas groupby会填充缺失的行

解决方案输入数据帧：LCLid energy(kWh/hh) day_time 2014-01-01 00:00:00 MAC000006 0.270453 2014-01-01…

人工智能 2023年7月7日
0065
使用classification learner训练好模型后如何调用模型对新的数据进行预测

使用classification learner训练好模型后如何调用模型对新的数据进行预测接上一篇文章MATLAB自带分类模型APP——classification learne…

人工智能 2023年7月3日
00108
图像多尺度特征融合、特征金字塔总结

参考链接： https://blog.csdn.net/qq_36268755/article/details/106192524?spm=1001.2014.3001.5502h…

人工智能 2023年5月26日
0069
使用OPTUNA对LightBGM自动调试参数，并进行绘图可视化

1.optuna基本使用 Optuna是一个自动帮助我们调试参数的工具，使用起来十分方便。比sklearn的gridsearchcv好用很多，一是因为optuna相比于sklear…

人工智能 2023年6月6日
00118
机器学习模型自我代码复现：Softmax分类

根据模型的数学原理进行简单的代码自我复现以及使用测试，仅作自我学习用。模型原理此处不作过多赘述，仅罗列自己将要使用到的部分公式。代码框架部分参照了以下视频中的内容。清华博士爆肝30…

人工智能 2023年7月1日
00111
Python 医学知识图谱问答系统（一），建立医学知识图谱，基于neo4j知识图谱的医学问答体系

医学知识问答，知识图谱建设部分，建设过程如下：一.首先，准备数据，主要为结构化的医学数据，包含实体和关系原始数据样式（来源于刘焕勇老师整理的医学数据）：二.在neo4j数据库…

人工智能 2023年6月1日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

论文阅读《Multi-Domain Dialogue Acts and Response Co-Generation》多领域对话行为和响应的协同生成

大家都在看