无监督文本摘要，生成式文本摘要

2023年5月30日下午8:59 • 人工智能 • 阅读 56

论文：Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and Context-Aware Auto-Encoders.AAAI2021

算法概要：

基于相似度选择对话主题句，然后借助降噪自编码器生成对话摘要。

训练：1、采用对比学习的思想训练句子相似度计算模型；

2、训练降噪自编码器用于后续生成对话摘要。

测试：基于MMR的想法，综合考虑重要性和冗余度选取对话主题句，然后使用降噪自编码器生成最终摘要。

一、论文贡献

提出无监督神经网络框架RankAE

RankAE组成：

1、训练句子相似度计算模型，选择主题句

2、DAE（去噪自编码器）

二、实现

训练相似度模型：

噪声数据构造：

1、片段插入：在同一聊天文本中采样词序列，插入到原始对话中，直到序列长度增加 40% 到 60% 的比例，此方法插入概率Pa；

2、句子替换，整个句子换成同一聊天的其他句子，被替换的句子在语料中删除，以便模型学会在粗粒度级别上过滤掉不相关的话语，概率Pr；

3、以概率Ps 保持话语不变。内容保留的目的是使表示偏向于实际观察到的话语；

train DAE

推理：

三、实验

实验数据：

实验结果：

说明：

LEAD是下限

ORACLE 是上限，有监督抽取式；

TRF为transformer

PacSum：通过构建有向图和添加基于边缘方向的权重约束来改进 TextRank；

MeanSum：使用来自输入句子的自动编码器表示的平均值来解码摘要；

SummAE：通过使用 DAE 和对抗性判别器联合重建文档和句子来生成简短的摘要；

示例：

Original: https://blog.csdn.net/qq_32091131/article/details/122889817
Author: 菜鸟ccc
Title: 无监督文本摘要，生成式文本摘要

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/545074/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Yolov5如何在训练意外中断后接续训练

Yolov5如何在训练意外中断后接续训练 1.配置环境 2.问题描述 3.解决方法 * 3.1设置需要接续训练的结果 3.2设置训练代码 4.原理 5.结束语 1.配置环境操作系…

人工智能 2023年7月20日
0094
QCC304x系列开发教程（实战篇) 之 9.13-QCC3040之语音助手调用

查看全部教程开发请点击：高通蓝牙耳机QCC304x开发详解汇总（持续更新中） 1、什么是语音助手？这里的语音助手主要指的是手机自带的语音助手功能（例如hi siri,或者小爱同学…

人工智能 2023年5月25日
0087
COCO数据集Keypoint标注格式梳理和使用COCO-Annotator在自有数据集上进行标注

这里写自定义目录标题 COCO数据集Keypoint标注格式 * COCO数据集官网 Keypoint Detection关键点检测 – 统一数据格式 Keypoint…

人工智能 2023年7月20日
00277
Pandas数据分析

什么是Pandas？一、读取数据 * 读取csv文件读取txt文件，自己指定分隔符、列名读取EXCEl文件读取MySQL数据库二、Pandas数据结构 * 仅有数据列表即…

人工智能 2023年7月15日
0077
Python 增强视频画质，就这么做！

文 | 闲欢来源：Python 技术「ID: pythonall」前面通过文章给大家介绍了如何读取、播放和保存视频，后面又通过文章给大家介绍了如何对图像的亮度、对比度、色度…

人工智能 2023年7月19日
0056
RTX3090 与pytorch版本对应关系

在RTX 3090 上判断，当前版本的的torch版本是否可以用，一般需要通过如下方式： conda activate torch1.8.1 ( 激活相关的虚拟环境) python…

人工智能 2023年7月20日
0063
OpenCV（C++版本）基础相关（2）：图像的读取与显示、颜色空间转换、创建和赋值、像素的读写操作、像素的算术操作

文章目录一、图片的读取与显示二、颜色空间的转换 * 2.1 创建一个头文件quickopencv.h 2.2 创建一个C++文件quickdemo.cpp 2.3 测试文件te…

人工智能 2023年7月20日
0064
数字通信之语音信号编码主要内容简介（五）

数字通信系列文章：数字通信相关基本概念（一）数字通信之抽样（二）数字通信之量化（三）数字通信之编码（四）数字通信之语音信号编码主要内容简介（五）数字通信之语音压缩编码基…

人工智能 2023年5月27日
0092
【FPGA】精品FPGA书籍推荐

最近几个月都没上CSDN，下面留言的小兄弟们对不住了，资料就不发了。自行百度吧。。最后，想特别强调一下，支持正版！尊重知识！电子档的阅读效率以及知识获取的效果远远不能与纸质…

人工智能 2023年5月30日
0085
selenium+python爬虫全流程教程

python+selenium爬虫全流程详解 selenium+python爬虫简介 * selenium测试脚本 python+selenium 模拟浏览器—-以ch…

人工智能 2023年7月4日
0068
conda环境名称消失问题

无名conda环境解决 conda env不显示名称 conda环境名称消失问题 * 问题复现及解决写在最后 conda环境名称消失问题最近在重装 ESPNET时候，遇到一件烦…

人工智能 2023年6月16日
00112
ImportError: cannot import name ‘Field‘ from ‘torchtext.data‘, No module named “legacy“

这些都是在下载最新的 torchtext后出现的问题，问题如标题，在 torchtext.data里面并没有 Field方法，以及通过别的博主在 data前加了 legacy却发现…

人工智能 2023年5月27日
00108
Topic 9. SCI 文章第二张表—单因素回归分析表

在SCI论文中，我们经常可以看见一些这样的表格，大多数命名表格 2.，主要用来表示原因和结果的单因素分析的关系或者是分组变量的关系，也就是单因素分析，那这样一张表格该怎么完成呢？ …

人工智能 2023年6月17日
0072
警惕AI，我搭建了一个“枪枪爆头”的视觉AI自瞄程序，却引发了一场“山雨欲来”

前言前段时间在网上看到《警惕AI外挂！我写了一个枪枪爆头的视觉AI，又亲手”杀死”了它》这个视频，引起了我极大的兴趣。视频中提到，在国外有人给使命召唤做…

人工智能 2023年6月23日
00568
Tensorflow-Gpu安装基于gtx1060

Tensorflow-gpu安装基于gtx1060最近学习tensorflow，网上各种gpu版本的安装太乱了，自己整合了一个 CUDA与显卡驱动：https://docs.nv…

人工智能 2023年5月24日
0088
BIM自动识别三维地图-Revit模型自动识别三维地图-IFC模型自动识别三维地图制作

1.以BIM模型及图纸轻量化解析与展示为基础，结合三维地图可视化、模型渲染与效果呈现、地图定位导航、后期数据地图维护等扩展功能，助力开发者打造以建筑信息模型为核心的多元管理平台。2…

人工智能 2023年6月4日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

无监督文本摘要，生成式文本摘要

大家都在看