Adversarial Generation of Continuous Images 阅读笔记

2023年6月22日下午8:22 • 人工智能 • 阅读 82

任务

在对图像的表示中，最经典的方式是利用矩阵对图片进行表达，但是这种表达方式将图片进行离散化了。而在真实的世界中，我们认为是连续的，或者近似连续的。于是，作者提出使用一个连续的函数来表示图像，再结合目前的神经网络，提出一个方案，即利用神经网络来逼近这个连续的函数。这种方案被称为INR(Implicit Neural Representation)，表达的公式如下:

Adversarial Generation of Continuous Images 阅读笔记

对于图像来说，INR将二维坐标映射到RGB的一个值。

上图是一个对比图，坐标为常规的卷积网络做图像生成的方法，右边为使用INR的方法。

解决的问题

(1)如何设计网络使得网络训练能够更稳定。为什么会有这么一个问题呢？因为这是一种hypernetwork，即利用网络去学习网络参数，因此在学习训练的过程中，更不容易稳定训练。

(2)如何处理高分辨率的图像，使得对硬件的耗费资料更小。在处理高分辨率图像的时候，由于这种方法需要对每一个单独的像素进行映射运算，因此会占用更高的内存消耗。

作者设计了factorized multiplica-tive modulation(FMM)的方法和multi-scale的方法去处理解决以上的问题。

方法

如上图的pipeline所示，是整个方法的流程，G是生成器，从高斯分布中采样进行生成，不过生成的是参数

。这个参数将用在INR模型F中，作为这个函数的参数。为了产生一张完整的图片，作者对一张图片的每一个grid都要进行运算。作者在这使用了傅里叶特征变换，对输入的坐标点进行了变换，将坐标映射为一个特征向量。

FMM（Factorized Multiplicative Modulation）

在计算的时候，作者一开始通过矩阵分解将学习的矩阵分成两个低秩矩阵，但是这种矩阵的分解方式会产生大量的0值奇异值从而影响GAN的训练。因此作者采取了一种折中的方案，Generator产生低秩矩阵，低秩矩阵相乘得到一个高阶矩阵，再经过一个激活函数之后，与一个可学习矩阵相乘，得到最后的矩阵。如下图所示：

通过生成器产生A和B矩阵，然后经过一个激活函数，和一个可学习的参数W相乘，最后得到最终的权重矩阵。

Multi-scale INRs

由于最终产生的是一个高分辨率的图片，作者通过多尺度计算的方式减少计算的开销。如下图所示：

不同的层次处理不同分辨率下的grid。这允许一个grid运算的时候与周围的grid共享计算。对于这个网络，在处理低分辨率的时候，用更多的神经元，在处理高分辨率的时候，用来更少的神经元。作者在做这个设定的时候，使用了和卷积相同的引导偏执，即一个像素受到周围像素的影响非常大。

思考

这篇论文个人认为做得很不错，但是受限于个人的知识，我有几个疑惑的地方:

(1)矩阵分解之后为什么会产生很多的0奇异值，它又是怎么影响GAN的训练效果的。

(2)F的各个block是如何做插值运算，提高分辨率的。

在补充完相关数学知识和阅读源代码后，会补充。

此外，个人认为这种方法应该能和点云进行一些联动。SP-GAN感觉已经是对这种方法的应用了。

参考文献：

Ivan Skorokhodov,Savva Ignatyev,Mohamed Elhoseiny:
Adversarial Generation of Continuous Images. CVPR 2021: 10753-10764

github地址:

GitHub – universome/inr-gan: Adversarial Generation of Continuous Images [CVPR 2021]

Original: https://blog.csdn.net/baidu_40582876/article/details/121651339
Author: 莫问前程学无止境
Title: Adversarial Generation of Continuous Images 阅读笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/645989/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

过程挖掘（Process Mining）6——流程发现（Process Discovery）（2）α算法

α算法是比较古老、原始和简单的流程发现算法，能够处理发现并发（concurrency）的能力，但在实践中不适用，因为存在一些问题（处理噪声、不频繁/不完整行为、复杂路由结构等）。这…

人工智能 2023年7月17日
0077
C++ Reference: Standard C++ Library reference: Containers

库Containers标准容器容器是一个持有者对象，它存储了其他对象（其元素）的集合。它们被实现为类模板，这使得作为元素支持的类型具有很大的灵活性。容器管理其元素的存储空间，并提供…

人工智能 2023年6月30日
0086
五、卷积神经网络CNN3（2D与3D卷积、池化）

2D卷积 2D 卷积操作如图 1 所示，为了解释的更清楚，分别展示了单通道和多通道的操作。且为了画图方便，假定只有 1 个 filter，即输出图像只有一个 chanel。其中，…

人工智能 2023年7月13日
0049
高斯滤波器讲解（python实现）

文章目录 * – 1.高斯滤波器 – 2.高斯函数讲解 – + （1）高斯函数 + （2）参数详解 + （3）高斯函数具体实现过程 + （3）那…

人工智能 2023年7月5日
0079
SegFormer论文记录（详细翻译）

SegFormer 论文记录代码：GitHub – NVlabs/SegFormer: Official PyTorch implementation of SegF…

人工智能 2023年6月17日
0088
【深度学习】模型过拟合的原因以及解决办法

【深度学习】模型过拟合的原因以及解决办法 1、背景 2、模型拟合 3、简述原因 4、欠拟合解决办法 5、过拟合解决办法 1、背景所谓模型过拟合现象：在训练网络模型的时候，会发现模…

人工智能 2023年7月27日
0084
DETR原理与代码精讲

Transformer在许多NLP(自然语言处理)任务中取得了最先进的成果。 DETR(Detection Transformer)是Facebook提出的基于Transforme…

人工智能 2023年7月10日
0057
比较pytorch与keras训练模型的不同并且在Pytorch中使用一维卷积神经网络对一维连续数据分类

卷积神经网络对于周期性的一维信号分类效果是比较好的，本人做电机故障检测，需要对不同故障的轴承振动信号进行分类。之前都是用keras搭建神经网络，确实很方便，使用fit（）函数训练…

人工智能 2023年6月30日
0093
猿创征文｜OpenCV 如何提高条形码识别率

猿创征文｜OpenCV 如何提高条形码识别率今天介绍一个使用OpenCV提高条形码识别率的算法 * 平台及OpenCV库简介强烈建议：先学习一下OpenCV的课程步入正题：从…

人工智能 2023年7月18日
0099
人工智能–遗传算法求解TSP问题

文章目录前言一、遗传算法的概念 * – 遗传算法（Genetic Algorithm, GA）：二、解决的问题对象三、程序步骤 * 1.针对TSP问题，确定编…

人工智能 2023年7月25日
0045
对比学习（二）-模型坍塌-infoNCE损失函数

接对比学习（一）对比学习（二） * – L2正则使用原因 – 模型坍塌 – infoNCE损失函数 – 负例难度 L2正则使用原因…

人工智能 2023年6月15日
0085
使用卷积神经网络(CNN)实现图片分类

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月2日
00105
【数据挖掘】第四章分类任务（决策树）

数据运营作用&意义知错能改，善莫大焉 —错在哪里，数据分析告诉你运筹帷幄，决胜千里 —怎么做好”运筹”，数据分析告诉你以往鉴来，未卜先知 —…

人工智能 2023年7月1日
0052
PyTorch 入门：训练一个深度神经网络(DNN)

准备知识 1. NumPy 为什么要学 NumPy？弄懂了 NumPy 的 array，可以轻松上手 PyTorch 的 tensor。请看这个对比：torch v.s. nump…

人工智能 2023年6月25日
0083
python2.7配置tensorflow1.5.0和keras2.1.6

说明：由于ROS使用的是python2，而之前网络模型训练的是python3.7，所以直接迁移会报错，需要重新配置python2.7的环境。 1. tensorflow的版本如果…

人工智能 2023年5月24日
0078
YOLOv5 源码解析 —— 卷积神经单元

YOLOv5 源码中，模型是依靠 yaml 文件建立的。而 yaml 文件中涉及到的卷积神经网络单元都是在 models 文件夹中的 common.py 声明的，所以自行设计网络结…

人工智能 2023年6月16日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Adversarial Generation of Continuous Images 阅读笔记

FMM（Factorized Multiplicative Modulation）

Multi-scale INRs

思考

大家都在看