【小样本学习】ICLR2022：基于原型记忆力和注意力机制的少样本图像生成

2023年6月3日上午5:05 • 人工智能 • 阅读 92

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:3311fc6f-d016-4978-be11-5617b3cbf41b

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:01c5f75d-b1ea-4819-b2ce-7a8aed8f161e

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:b7b7817b-a786-4b81-9453-25c59d61ef41

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:8ce4fc45-cc4d-4777-9ee5-1e16b2d0dec1

原文链接：https://openreview.net/pdf?id=lY0-7bj0Vfz

知乎同步更新：id为cocotaini

摘要：

猕猴的大脑视觉皮质层的表层有神经编码，这种编码复杂、多样、稀疏。引人联想到计算机语言中的grandmother cell。本文假设这些单元作为记忆原型，在大脑生成图像的过程中，进行特征处理。这些记忆力原型通过聚类形成，并通过一种注意力操作来应用。本文提出的该方法叫做MoCA（Memory Concept Attention），提高少样本图像生成质量。本方法，提高了生成质量并由可解释的视觉概念聚类，提高模型的鲁棒性。

1 概述

神经生物学中有一个现象，一些复杂的神经元，对于他们更偏向的模型会表现出更强烈的反射。这些神经元的高度选择性表示，他们类似特定模型检测器。因为这种对于复杂刺激表现出的选择性，这些神经元的数量就非常稀疏，4~6：1000的比例。本文将高选择性、稀疏响应的特征检测器成为”grandmother cell”，他们对特定原型有明确的编码方式，一个原型对应一个神经元的稀疏聚类而不只是一个神经元。

本文假设”grandmother neurons”作为原型记忆力先验，调节图像生成过程。这些先验知识让这个过程通过当时的空间上下文进行，运用原型记忆力进行不断学习和积累。”grandmother cell”在记忆注意力过程中作为结构化概念先验，进行图像生成。

MoCA模块，在GAN网络中的每一层之前都插入一个，作为每层的预置生成器。

本文实验backbone：sota StyleGAN2和新网络FastGAN。

另外，本文发现在测试阶段，带有MoCA的生成器可以在一定程度上，抑制噪声。说明在生成阶段使用结构化记忆力先验可以增加模型的鲁棒性。

2 相关工作

视觉概念学习：

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0effcef6-5285-464d-aff4-00bce5e09a00

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:678197b1-47a0-499d-ae76-dfe4a26fb10b

自注意力：

现在的自注意力GAN网络只局限于使用桐言的图像的上下文信息来调节激活。

原型记忆力机制：

本文在low-level使用memory bank，来存储原型。

少样本原型学习：

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0b3cf698-70d3-4d0c-bad8-17e6bdadd14b

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:b8141b3c-d435-4a67-98a2-505f72f75301

3 方法

本文主要贡献是引入基于原型记忆力的调节模块，从而提高GAN的生成器。前面的网络层的激活在两个注意力过程中被修改：（1）MoCA的上下文调节（2）自注意力的空间上下文调节。这个模块把GAN的feature map作为输入，结合以上两个机制的结果，来调节后续处理过程。

模型流程概括如图1。

图1：在MoCA中，激活向量A作为输入，首先通过1×1卷积降至低维空间，用来选择最接近的予以单元。选出的单元会将在他的聚类中的原型记忆力单元加入到MoCA中，生成一种调节机制，通过一种1×1网络O从内置空间映射回特征空间；在自注意力中，整张特征图A通过两个相关的1×1卷积核，转化成了键值对–>结合query向量–>映射回特征空间。最后，通过两种途径得到的输出整合到一起，形成了下一层的输入。

本文用MoCA层的输入表示一个特定层的激活A。输出提供了一个调节函数H，用来更新激活A。使用1×1卷积将A降维到低维空间，使得A可以更灵活的进行调节。

3.1 原型记忆力学习

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:506df1cb-17e7-429f-b381-033b4bce1212

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:e98c2ea3-4136-4e2d-b635-7ae245f96cba

假设，记忆力P包含M个语义单元，对于每个语义单元Ki，有T个原型单元Eij，存储在记忆单元中，并与Ki关联，Ki是存储的原型单元的均值。这些原型单元来自之前迭代的特征图，这些特征图通过上下文编码器进行动态更新，在每次训练迭代结尾在记忆力中进行更新。

每个激活，在降维之后，在特征途中都被分配到距离最近的语义聚类中，取代了一个在该聚类的memory bank已有的原型单元。使用随机取代机制防止 过拟合。

3.2 记忆力概念注意力机制

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:eaebc252-08f3-4cf2-aa5d-3a7523c51cb5

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:c70bac23-7762-41ef-b84d-a32ce6e2a13f

该过程是，一个激活向量a选出最近的语义单元Ki，回退到记忆力中找出相关的原型单元矩阵Ei。Ei中的每一列j都是一个原型单元Eij。第二步，用Ei注意a。先计算a和Ei的相似指数s；对s进行非线性softmax归一化，获得归一化注意力权重β。

利用权重β，从记忆力hm中为激活a建立回退的信息。对于每个batch中的每个图像的每个空间位置都进行同样的对a的操作，获得矩阵Hm。

3.3 空间上下文注意力

记忆力先验很重要，但是空间上下文信息对于激活调节来说也很重要。本文还使用了非本地的网络对相同的层使用了空间上下文调节。特别的，作者首先计算了降维后的两个A之间的相近关系映射图，记作S。S的每一行都通过softmax进行归一化，一边计算稀疏注意力权重。最后获得空间上下文调节张量Hs。

3.4 两种调节的结合

Hm和Hs元素对应相加，获得H。通过1×1卷积，转化回到原始特征空间。可学习参数γ作为H的权重相乘，和输入的激活A相加，用来更新A，成为下一层生成器的输入。

4 实验

本文是GAN图像生成，略

Original: https://blog.csdn.net/cocotiani/article/details/124076613
Author: cocotiani
Title: 【小样本学习】ICLR2022：基于原型记忆力和注意力机制的少样本图像生成

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/563159/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

xarray学习（二）Working with pandas

目录 * – 和pands一起操作 – + Dataset and DataFrame + DataArray and Series + Multi-dim…

人工智能 2023年7月7日
0042
机器学习（4）——弱监督学习

什么是弱监督学习？监督学习技术通过学习大量标记的训练样本来构建预测模型，在很多领域获得了巨大成功。但由于数据标注的本身往往需要很高成本，在很多任务上都很难获得全部真值标签这样比较…

人工智能 2023年6月24日
0095
【R语言】实验四数据分析

hospital-data 数据集数据是关于一些医院的基础信息，数据包含13个字段，包含的字段分别为：供应商编号、医院名、地址 1、地址2、地址3、所处城市、所处州、邮编、所处乡…

人工智能 2023年6月11日
0078
Python数据库编程之pymysql详解

文章目录前言一、pymsql的安装二、连接数据库三、创建和管理数据库四、创建和管理表总结前言学习之前务必安装MySQL并已启动相关服务，MySQL安装方法及查看初始…

人工智能 2023年7月4日
0067
Ubuntu下使用opencv完成图像程序编程操作

前言一、安装opencv 1.1安装环境 1.2下载OpenCV 1.3解压opencv包 1.4使用cmake安装opencv 1.5使用 make 创建编译 1.6安装 1….

人工智能 2023年7月18日
0058
【实体识别】深入浅出讲解命名实体识别（介绍、常用算法）

命名实体识别的背景命名实体识别（Named Entity Recognition, 简称 NER）（也称为实体识别、实体分块和实体提取）是信息提取的一个子任务，旨在将文本中的命名…

人工智能 2023年7月26日
00142
C++常用的图像像素值读写的方法

Index 目录索引写在前面先修知识使用at()函数访问像素值使用Mat的成员函数ptr< >( )访问像素值案例演示参考文章写在前面做CV领域的小伙伴…

人工智能 2023年7月18日
0060
stm32cubemx hal学习记录：PWR 低功耗睡眠模式

一、低功耗睡眠模式简介 1、简介睡眠模式分为两种进入方式：①调用WFI命令。②调用WFE命令。相同点：睡眠模式：内核停止，所有外设包括M3核心的外设，如NVIC、系统时钟等仍在…

人工智能 2023年6月29日
00113
Pytorch(Tensor)-Numpy(ndarrays) API对照表

pytorch的 tensor和 numpy和 ndarray可以说是每一个深度学习工程师必须熟悉的基础工具，而这两个用法相近，但又有部分差异的”轮子”，…

人工智能 2023年6月29日
0075
深度学习基础及实现的必备步骤

为什么要以均方误差作为损失函数？(将模型在每个训练样本上的预测误差加和，来衡量整体样本的准确性) 解：利用均方误差画出来的图像有如下特点曲线的最低点是可导的。越接近最低点，曲线…

人工智能 2023年7月13日
0059
JumpServer手动部署

1、服务器准备：硬盘配置：2核CPU、4G内存、50G以上硬盘。需要安装的软件： python3.6 mysql大于5.6 redis 缓存型数据库 2、环境准备： 1）关闭防…

人工智能 2023年6月29日
00174
matlab：鼠标循环点击器

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0051
Python备忘录（自用）

师兄之前整理的python备忘录，上传防丢 1. Anaconda Prompt 怎么切换工作路径到E盘以及更改默认打开路径？链接: https://blog.csdn.net…

人工智能 2023年5月25日
0082
IARNN-Based Semantic-Containing Double-Level Embedding Bi-LSTM for Question-and-Answer Matching 论文阅读

待完成 Sum：提出了一个新的端到端方法，包含语义的双层嵌入双向LSTM模型（ SCDE-Bi-LSTM），解决医疗领域QA匹配的三个关键问题。三个问题：（提出的解决方法）1）现…

人工智能 2023年5月31日
0070
深度学习（PyTorch）——shape、view、reshape用法及其区别

一、python中的view（）函数的用法初学者在使用pytorch框架定义神经网络时，经常会在代码中看到：这样的用法。 view()的作用相当于numpy中的reshape，…

人工智能 2023年7月22日
0079
Vision Transformer详解

论文名称： An Image Is Worth 16×16 Words: Transformers For Image Recognition At Scale论文下载链…

人工智能 2023年6月25日
00122

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【小样本学习】ICLR2022：基于原型记忆力和注意力机制的少样本图像生成

视觉概念学习：

自注意力：

原型记忆力机制：

少样本原型学习：

3.1 原型记忆力学习

3.2 记忆力概念注意力机制

3.3 空间上下文注意力

3.4 两种调节的结合

大家都在看