Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

2023年6月16日上午10:27 • 人工智能 • 阅读 73

Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

背景和动机

本文是一篇2021年ICCV的关于图像inpainting的文章。从题目就可以看出，本文依然是通过图像边缘信息来辅助图像inpainting。以往这类模型在纹理信息和结构信息修复和通常是割裂进行的，或者是先单独进行结构信息修复，在用其辅助整个图像的修复。然而本文却指出，由于在inpainting过程中， 纹理信息和结构信息在修复时是相互影响的，二者应该是相互促进的关系，因此之前的研究中认为二者互补，将二者割裂来进行训练的方式不符合事实。

方法介绍

为了使得图像纹理信息的修复和结构信息的修复能够相互促进，本文提出了一种双流的网络结构（这里要注意，双流结构并不是两阶段网络结构）：

Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

如图所示，整个网络由三部分组成，分别是：①、纹理信息编解码器和结构信息编解码器；②、特征融合模块；③、鉴别器。
对于第①部分，是由两个相互交织在一起的U-Net网络组成，这个U-Net网络有两个输入，第一个输入是缺失图像和对应的mask，通过纹理编码器得到一连串不同尺度的特征图。第二个输入是缺失图像的edge图和对应的mask，通过结构编码器得到一连串不同尺度的特征图。之后纹理编码器的最后一层特征输出会进入到结构解码器中进行反卷积，并且在每一级反卷积时结构编码器相应分辨率的特征图都与之skip connections。对应的结构编码器的最后一级输出也输入到纹理解码器中，纹理信息编码器对应分辨率的特征图与之skip connections。这样，在纹理和结构信息恢复的过程中，就可以得到彼此的高维信息作为补充。
对于第②部分，其实是为了将第①部分得到的两种特征进行更深层次的融合。这一部分由Bi-directional Gated Feature Fusion (Bi-GFF)和Contextual Feature Aggregation (CFA)构成。
先来说Bi-GFF模块：Bi-GFF的目的是控制两种特征融合时的交互比例。

再来说CFA模块：CFA的目的是强化local特征之间的相关性，这样就可以使得整个inpainting结果变得更加和谐。CFA模块可以分为两个阶段，如图所示：

第一阶段是通过attention来加强局部特征与全局之间的联系。首先CFA通过一个卷积模块将F b F_b F b 转化为一个特征图F F F，之后F F F被分割为一堆3 × 3 3 \times 3 3 ×3的patch。我们将这些patch做归一化内积：

之后，我们依照这个attention矩阵重建所有的patch：

这一步的意思就是每一个patch都依照attention矩阵，通过N N N个patch（包括自身）的加权和的形式重新获得，我们将重新获得的patch再还原成特征图F r e c F_{rec}F r e c 。然后是第二阶段，通过多尺度的方式对特征进行再次聚合。F r e c F_{rec}F r e c 通过四种不同扩张率1 , 2 , 4 , 8 {1,2,4,8}1 ,2 ,4 ,8的扩张卷积（ 个人认为这个比例选择的不好，根据常识，有着大于1的公约数的扩张卷积组合会造成盲区），获得四种不同尺度的特征图F r e c 1 , F r e c 2 , F r e c 4 , F r e c 8 F^1_{rec}, F^2_{rec}, F^4_{rec}, F^8_{rec}F r e c 1 ,F r e c 2 ,F r e c 4 ,F r e c 8 ，同时构建一个简单的生成器G w G_w G w 用来生成上面四种特征图的权重图W 1 , W 2 , W 3 , W 4 = S l i c e ( G w ( F r e c ) ) {W_1, W_2, W_3, W_4}=Slice(G_w(F_{rec}))W 1 ,W 2 ,W 3 ,W 4 =S l i c e (G w (F r e c ))。最后通过公式：

将不同尺度的特征图进行聚合，就获得了CFA的最终输出。
对于 第③部分没什么好说的，就是简单的双流鉴别器，同时接受生成图像和生成的结构图，并将提取的特征concat在一起来判别真假。
对于损失部分，都是比较常规的损失：重构、感知、风格、对抗。唯一值得提一下的是本文额外引入了所谓的Intermediate Loss用来监督第①部分的两个生成特征图：

其中P s ( . ) P_s(.)P s (.)和P t ( . ) P_t(.)P t (.)是两个简单的残差块。由于结构特征图是0-1图，因此用二分类交叉熵来约束。

; 总结

这篇论文内容挺多，值得简单的总结一下：
1、首先本文使用的双流网络结构让人眼前一亮，相当于编码阶段提取对应的纹理特征和结构特征，解码阶段将另外一种特征的高纬特征用于辅助解码。然而有一点值得思考：在编码阶段，对于结构特征过深的下采样（本文最后编码器输出的特征分辨率是2 × 2 2 \times 2 2 ×2）可能有利于保留全局结构，对于纹理特征是否已经被压缩的难以利用了？
2、在CFA的第一阶段，使用内积的方式计算相似度矩阵，假设F ∈ R c , w , h F \in R^{c,w,h}F ∈R c ,w ,h，则在这一步的计算量就是O ( c × h w / 9 × h w / 9 ) O(c \times hw/9 \times hw/9)O (c ×h w /9 ×h w /9 )。是否有其他方式降低这一步的计算量？

Original: https://blog.csdn.net/qq_37614597/article/details/123937727
Author: 涑月听枫
Title: Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623365/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

nvidia-smi 命令详解

nvidia-smi 命令详解简介 nvidia-smi – NVIDIA System Management Interface program nvidia sm…

人工智能 2023年7月4日
0053
C/C++实战——基于Qt框架和visual studio的海康相机SDK二次开发

最近在进行机器视觉系统的搭建，积累了经验，想和大家讨论、互相学习。相机是图像的来源。为了搭建视觉系统，完成图像分析、机器视觉任务，需要编程控制相机按工作所需的曝光、增益和帧率同步采…

人工智能 2023年5月26日
0085
技术干货 | 一文弄懂差分隐私原理！

随着互联网的迅猛发展，网络早已融进人们日常生活的方方面面，我们的个人隐私在互联网时代几乎已经不是秘密。在数据时代，如何保护自己的隐私呢？差分隐私又是什么？小编用一篇文章带领大家了解…

人工智能 2023年7月13日
0081
opencv c++ circle()函数、putText()函数小结

1、circle()函数模板：circle(cv::InputOutputArray img,cv::Point center,int radius,const cv::Scala…

人工智能 2023年7月19日
00157
RNA 13. SCI 文章中加权基因共表达网络分析之 WGCNA

WGCNA 分析流程 2008 年发表在 BMC 之后的影响力还是很高的，先后在各大期刊都能看到，但是就其分析的过程来看，还是需要有一定 R 语言的基础才能完整的复现出来文章中的结…

人工智能 2023年5月31日
0097
垃圾邮件分类

sklearn实现垃圾邮件分类准备数据抽取特征数据划分训练集，验证集，训练模型评估模型准备数据链接：https://pan.baidu.com/s/1DcyiUgFT1…

人工智能 2023年7月3日
0063
Detection of Rail Surface Defects Based on CNN Image Recognition and Classification-论文阅读笔记

Detection of Rail Surface Defects Based on CNN Image Recognition and Classification 基于CNN图…

人工智能 2023年6月20日
0070
基于聚类的图像分割-Python

点击上方” 小白学视觉“，选择加” 星标“或” 置顶“ 重磅干货，第一时间送达了解图像分割当我们在做一个…

人工智能 2023年5月31日
0085
【python】之字典及其操作

个人主页：天寒雨落的博客_CSDN博客-C,CSDN竞赛,python领域博主特别标注：仅为自己的学习记录笔记，方便复习和加深记忆，仅供借鉴参考！目录前言字典的创建格式 …

人工智能 2023年6月23日
0083
R语言聚类分析——代码解析

+（1）实验数据：iris鸢尾花数据 datd(iris) head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width…

人工智能 2023年6月2日
0096
《Python程序设计与算法基础教程（第二版）》江红余青松课后选择题课后填空题答案

一、选择题 Python语言属于 C A.机器语言 B.汇编语言 C.高级语言 D.以上都不是在下列选项中，不属于Python特点的是 B C.可移植性 D.免费和开源 A.面向…

人工智能 2023年7月29日
0074
Pyhton学习记录（二）利用鸢尾花进行简单数据分析

本文主要内容 1 导入本文所有需要的库 2 数据预处理 3 数据可视化 4 模型训练与测试 1 导入本文所有需要的库 from sklearn.datasets import lo…

人工智能 2023年7月15日
0088
python相关性分析

什么是相关性相关性分析是指对两个或多个具备相关性的变量元素进行分析，从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性的…

人工智能 2023年7月14日
0067
冲刺数据库系统工程师第5天

最近要开始备考软考中级工程师了每天分享一点数据库系统工程师的题目及解答，帮助有需要的朋友顺利上岸！这题选D 这题应该不需要过多的解释这题选B、D 外模式也成为用户模式或子模式…

人工智能 2023年7月17日
0061
点云数据增强及预处理

数据增强： 1. random world flip：沿着x或者y轴，翻转点云点云的x或者y，要翻转3d box中心的x或者y，要翻转3d box的朝向要翻转point segme…

人工智能 2023年6月2日
0085
第10章聚类分析(CA)

1 概念 聚类分析又称群&…

人工智能 2023年5月31日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

Image Inpainting via Conditional Texture and Structure Dual Generation 论文解读和感想

背景和动机

方法介绍

; 总结

大家都在看