可控文本生成技术

2023年5月28日下午2:53 • 大数据 • 阅读 76

介绍

Prabhumoye 等人[1]对可控的文本生成技术进行了综述，神经控制文本生成是一个重要的研究领域，因其应用的广泛性而备受关注。这篇论文中提供了一个新的模式的流水线生成过程，把它分为五个模块，包括外部输入控制、序列输入控制、生成器控制、输出控制及训练控制。

可控文本生成技术

; ① 外部输入:

a) 引入外部可控向量 s 作为输入。引入的方法有:
1.concatenation: h0 = [he; s];
2. linear transform: h0 = tanh(w1 he + w2 s + b)。其中he为 encoder 输出隐层向量，h0为 decoder 的输入。
论文中提到 linear transform 效果要比 concatenation 好。

b) Stochastic changes: Variational auto-encoder。VAE 用于可以将控制属性表示为隐变量 z，比如 style，topics，strategies 等; 但很难用于基于 content 的任务，如: 具体的信息，keywords，或者 entities。

c) Decompose: he解构为多种 subspaces。Decompose 方法需要输入 x 中包含控制属性的信息; 不适用与外部提供的控制属性。

d) External Feedback: adversarial loss。

② 序列输入

在 decoder 的每个时间步加入控制向量 s。不过这样效果不如对外部输入进行操作。

③ 生成器

对 RNN 的变体，和 attention 结合。Transformer-based 模型， Pre-trained model， GPT2，BEAR， PPLM。

④ 输出

a) Attention
b) Adversarial loss
c) Linear transform

⑤ 训练目标

a) General loss: Cross entropy loss; Unlikelihood loss; Decoding strategies
b) KL divergence
c) Classifier loss
d) Task specific loss: Strategy loss; Coverage loss; Structure loss

很多工作是将上述几种方法结合来控制文本生成。

参考文献：

[1] Prabhumoye S, Black A W, Salakhutdinov R. Exploring Controllable Text Generation Techniques[J]. arXiv preprint arXiv:2005.01822, 2020.

Original: https://blog.csdn.net/weixin_43729393/article/details/123817014
Author: victorup
Title: 可控文本生成技术

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532177/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从Hadoop框架来入门学习数据仓库概念

大数据 2023年11月14日
0034
0

000 posted on2022-02-28 23:21 风中明月阅读(5 ) 评论() 编辑 Original: https://www.cnblogs.com/nzpdbk…

大数据 2023年6月3日
0074
mongodb 初体验

1、docker 安装 docker run -d -p 27017:27017 –name mongo mongo:latest 2、自定义数据库并创建用户进入操作…

大数据 2023年6月3日
0071
Kafka Producer 的缓冲池机制【转】

在新版的 Kafka Producer 中，设计了一个消息缓冲池，在创建 Producer 时会默认创建一个大小为 32M 的缓冲池，也可以通过 buffer.memory 参数指…

大数据 2023年5月28日
0093
SQLite3入门学习

一、Linux下安装sqlite3 shell脚本安装sqlite3 #!/bin/bash library install path INST_PATH=pwd/../insta…

大数据 2023年11月10日
0040
基于 Apache Hudi 极致查询优化的探索实践

摘要：本文主要介绍 Presto 如何更好的利用 Hudi 的数据布局、索引信息来加速点查性能。湖仓一体（LakeHouse）是一种新的开放式架构，它结合了数据湖和数据仓库的最佳…

大数据 2023年6月2日
0066
数据分析基本过程-python

数据分析参考 python数据分析与挖&amp…

大数据 2023年5月26日
0056
使用Redis解决高并发方案以及思路讲解

大数据 2023年11月15日
0042
使用 Device Mapper来改变Docker容器的大小

如果在 CentOS 、 REHL 、 Fedor 或者其他默认没有 AUFS 支持的 Linux 发行版上使用 Docker ，你可能需要用到 Device Mapper 的存储…

大数据 2023年5月29日
0087
听杰伦新歌发现QQ音乐元宇宙，权游角色关系可视化地图、VNote 工具(Typora:勿cue谢谢)、最新论文 | ShowMeAI资讯日报

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

大数据 2023年5月28日
0066
【springboot进阶】SpringBoot整合RedisTemplate配置多个redis库

大数据 2023年11月15日
0030
JVM 异常处理原理

JVM 异常处理原理异常相关概念 Java异常抛出类型有两种：显式抛出：抛出异常的主体是应用程序，它指的是程序在代码中使用 throw 关键字进行异常抛出。隐式抛出：抛出异常…

大数据 2023年5月28日
0070
没有sudo权限的情况下，如何在Ubuntu安装sqlite

错误安装正确安装以下过程不可以在无权限情况进行，之所以撰写这一段是因为在一开始很多步骤都可以顺利执行，但是进行到最后一步make install命令中在我进行安装的Ubuntu…

大数据 2023年11月10日
0040
Taming Pretrained Transformers for Extreme Multi-label Text Classification

In this paper, we propose X-Transformer, the first scalable approach to fine-tuning deep t…

大数据 2023年5月28日
0077
数据库的操作以及数据库sqlite3常用的API接口

1.1 数据库的安装（VMware虚拟机下）离线安装： sudo dpkg -i libsqlite3-dev_3.22.0-1ubuntu0.4_amd64.deb sudo…

大数据 2023年11月11日
0030
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战（附源码）

大数据 2023年11月15日
0044

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球