超分之EDSR

2023年6月16日下午3:01 • 人工智能 • 阅读 101

这篇文章是SRResnet的升级版——EDSR，其对网络结构进行了优化(去除了BN层)，省下来的空间可以用于提升模型的size来增强表现力。此外，作者提出了一种基于EDSR且适用于多缩放尺度的超分结构——MDSR。

EDSR在2017年赢得了NTIRE2017超分辨率挑战赛的冠军。

参考目录：
①深度学习端到端超分辨率方法发展历程
②【图像超分辨】EDSR
③源码(Pytorch)
④源码(Facebook-torch)
⑤源码(Tensorflow)

Enhanced Deep Residual Networks for Single Image Super-Resolution

Abstract
1 Introduction
2 Related Works
3 Proposed Methods
*
3.1 Residual blocks
3.2 Single-scale model
3.3 Multi-scale model
4 Experiments
*
4.1 Datasets
4.2 Training Details
4.3 Geometric Self-ensemble
4.4 Evaluation on DIV2K Dataset
4.5 Benchmark Results
5 NTIRE2017 SR Challenge
6 Conclusion

Abstract

作者推出了一种加强版本的基于Resnet块的超分方法，它实际上是在SRResnet上的改进，去除了其中没必要的的BN部分，从而在节省下来的空间下扩展模型的size来增强表现力，它就是 EDSR，其取得了当时SOAT的水平。
此外，作者在文中还介绍了一种基于EDSR的多缩放尺度融合在一起的新结构——MDSR。
EDSR、MDSR在2017年分别赢得了NTIRE2017超分辨率挑战赛的冠军和亚军。
此外，作者通过实验证明使用L 1 − L o s s L1-Loss L 1 −L o s s比L 2 − L o s s L2-Loss L 2 −L o s s具有更好的收敛特性。

1 Introduction

近几年来，深度学习在SR领域展现了较好的图像高分辨率重建表现，但是网络的结构上仍然存在着一些待优化的地方：

深受神经网络的影响，SR网络在 超参数(Hyper-parameters)、 网络结构(Architecture)十分敏感。
之前的算法(除了VDSR)总是为特定up-scale-factor而设计的SR网络，即scale-specific，将不同缩放尺度看成是互相独立的问题，因此我们需要一个统一的网络来处理不同缩放尺度的SR问题，比如× 2 , 3 , 4 \times 2,3,4 ×2 ,3 ,4，这比训练3个不同缩放尺度的网络节省更多的资源消耗。

针对第一个网络结构问题，作者在SRResNet的基础上，对其网络中多余的BN层进行删除，从而节约了BN本身带来的存储消耗以及计算资源的消耗，相当于简化了网络结构。此外，选择一个合适的loss function，作者经过实验证明L 1 − L o s s L1-Loss L 1 −L o s s比L 2 − L o s s L2-Loss L 2 −L o s s具有更好的收敛特性。
Note：

MSE就是典型的L 2 − L o s s L2-Loss L 2 −L o s s。

针对第二个多缩放尺度问题，作者用2种不同的方式去处理：

使用低缩放尺度(× 2 \times 2 ×2)训练之后的模型作为高缩放尺度的初始化参数，结果取得很好的表现，说明不同尺度之间是有内在相关联系的。
作者设计以了一个可以结合多尺度的SR网络MDSR，除了网络的头部和尾部为各个缩放尺度独立之外，中间部分是共享网络。这种多尺度SR网络具有和单一缩放网络相近的表现力，且相比n n n个单一网络，n n n个尺度相结合的MDSR消耗更少的资源。

EDSR和MDSR将在标准测试数据集上做测试，分别是 Set5、Set14、B100、Urban100以及新的数据集 DIV2K。结果显示两种算法在PSNR/SSIM上都取得了SOAT的表现，并在NTIRE2017超分大赛上包揽冠亚军。

2 Related Works

略

3 Proposed Methods

本节将正式开始介绍一种增强版本的SRResNet——EDSR(一种single-scale网络)，它通过移除了适合分类这种高级计算机视觉任务而不适合SR这种低级计算机视觉任务的BN层来减少计算资源损耗。
除此之外，本节还会介绍一种集合了多尺度于一个网络中的multi-scale超分网络——MDSR。

Note：

BN不适合超分任务的原因：点这里。

3.1 Residual blocks

移除BN有以下三个好处：

这样模型会更加轻量。BN层所消耗的存储空间等同于上一层CNN层所消耗的，作者指出相比于SRResNet，EDSR去掉BN层之后节约了40 % 40\%4 0 %的存储资源。
在BN腾出来的空间下插入更多的类似于残差块等CNN-based子网络来增加模型的表现力。
BN层天然会拉伸图像本身的色彩、对比度，这样反倒会使得输出图像会变坏，实验也证明去掉BN层反倒可以增加模型的表现力。

; 3.2 Single-scale model

EDSR是SRResNet的增强版本，是一种基于上图红框所示的残差块。

Note：

连接①是将不同level的特征信息进行合并；连接②是ResNet块内部的残差连接。
在EDSR的baseline中，是没有residual scaling的，因为只是用到了64层feature map，相对通道数较低，几乎没有不稳定现象。但是在最后实验的EDSR中，作者是设置了residual scaling中的缩减系数为0.1，且B = 32 , F = 256 B=32,F=256 B =3 2 ,F =2 5 6。

增加模型表现力最直接的方式就是增加模型的参数(复杂度)，一般可以通过增加模型层数B B B(即网络深度)以及滤波器个数F F F(即网络宽度或者说通道数)。此外两者对于存储资源的消耗大约是O ( B F ) O(BF)O (B F )，增加的参数大约是O ( B F 2 ) O(BF^2)O (B F 2 )，因此增加滤波器个数才能在有限存储空间下最大化参数个数。

在Inception-ResNet这篇文章以及本文中都指出，过大的滤波器个数(feature map个数，或者说通道数)会导致网络不稳定，最佳的解决办法不是降低学习率或者增加BN层，而是通过在残差块最后一层卷积后加上Residual scaling层：

3.3 Multi-scale model

上图蓝色线表示的用训练好的up-scale-factor=2的EDSR网络作为× 3 , 4 \times 3,4 ×3 ,4训练时候的初始化参数，结果来看收敛速度以及表现力的提升都是有目共睹的，这一定程度上说明了不同缩放尺度之间是存在某种内在联系的。

因此作者设计了一种在单一网络中实现多尺度融合的SR网络——MDSR，其结构如下：

Note：

总体来说，MDSR是基于EDSR的结构。
预处理阶段的残差块中的卷积采用较大的5 × 5 5\times 5 5 ×5卷积核来增大初始阶段的感受野。
作者统计了一笔数据，训练3个单独的EDSR-baseline来实现不同放大倍数的SR需要消耗1.5 M ∗ 3 = 4.5 M 1.5M*3=4.5M 1 .5 M ∗3 =4 .5 M的参数量；而训练一个MDSR的baseline需要3.2 M 3.2M 3 .2 M的参数量，而MDSR在后续实验中表现也还不错，因此MDSR是一种资源消耗相对少且有一定表现力的SR网络。

下表是SRResNet、EDSR、MDSR资源占用统计：

; 4 Experiments

4.1 Datasets

需要介绍一下新的数据集 DIV2K，这是包含了2K高分辨率图像的数据集：训练集800张、验证集100张、测试集100张。
其余的标准benchmark： Set5、Set14、B100、Urban100。

4.2 Training Details

输入是数据集中的patch部分，RGB格式的48 × 48 48\times 48 4 8 ×4 8大小。
通过水平翻转和90°旋转来做数据增强。
Adam做优化。
mini-batch=16。
学习率从1 0 − 4 10^{-4}1 0 −4开始，每过2 × 1 0 5 2\times 10^5 2 ×1 0 5个epoches，就减半一次。
对于EDSR中× 3 、 4 \times 3、4 ×3 、4的网络训练的初始化参数，是采用训练完毕的× 2 \times 2 ×2EDSR网络的参数。而× 2 \times 2 ×2的EDSR是从头开始训练的。
EDSR和MDSR都采用L 1 − L o s s L1-Loss L 1 −L o s s，作者通过大量实验表明L1比L2有更好的收敛特性。

4.3 Geometric Self-ensemble

几何自集成的方法用于在测试的时候，将每一张输入图像经过8种不同(其中一种是原图)的变换方式进行转换：
I n , i L R = T i ( I n L R ) I_{n,i}^{LR} = T_i(I_n^{LR})I n ,i L R =T i (I n L R )然后将8个结果通过网络输出成{ I n , 1 S R , I n , 2 S R ⋯ , I n , 8 S R } {I^{SR}{n,1},I^{SR}{n,2}\cdots, I^{SR}{n,8}}{I n ,1 S R ,I n ,2 S R ⋯,I n ,8 S R }，然后将每一个值经过转置处理：
I ~ n , i S R = T i − 1 ( I n , i S R ) ， \tilde{I}^{SR}{n,i} = T_i^{-1}(I_{n,i}^{SR})，I ~n ,i S R =T i −1 (I n ,i S R )，最后在此基础上进行平均处理：
I n S R = 1 8 ∑ i = 1 8 I ~ n , i S R . I^{SR}n = \frac{1}{8}\sum^8{i=1}\tilde{I}^{SR}_{n,i}.I n S R =8 1 i =1 ∑8 I ~n ,i S R .最后拿着最终的结果去计算PSNR/SSIM，即图表中的EDSR+、MDSR+，从实验结果来看，self-ensemble确实可以提升表现力。

4.4 Evaluation on DIV2K Dataset

在DIV2K验证集(测试集不公开)中实验结果如下：

Note：

从结果来看，L1比L2-Loss更能对表现力进行提升。
Geometric Self-ensemble确实可以提升表现力。
EDSR在DIV2K上获取最佳的表现，其次MDSR也表现尚可。

; 4.5 Benchmark Results

作者对多种SR算法在Benchmark上的表现进行统计，结果如下：

Note：

总体来看，EDSR和MDSR是包揽了最佳和次佳的表现结果。
从SRResNet和EDSR的对比来看，去除了BN层确实对表现力有提升效果。

5 NTIRE2017 SR Challenge

下面是EDSR和MDSR在NTIRE2017超分挑战赛上的表现，当时获取了第一和第二名的结果：

; 6 Conclusion

文章的贡献如下：

提出了一种增强型SRResNet的scale-specific网络——EDSR，它以残差块为基础，移除了不适合SR任务的BN块，从而减轻网络以及增强了网络的表现力，同时也使得BN空出来的部分可以插进更多的CNN来进一步提升网络的拟合能力。
为了减缓feature map过多(滤波器过多或者说通道数过大)带来训练不稳定的问题，作者借用Inception-ResNet那篇文章说的residual scaling技术加入到EDSR的残差块最后一层CNN后。
提出了一种在单一网络中实现多尺度融合的SR网络——MDSR，包括× 2 、 3 、 4 \times 2、3、4 ×2 、3 、4。相比训练3个不同单一尺度的SR网络，MDSR可以节省更多的参数。
作者经过大量实验表明，L1-Loss比L2-Loss具有更好的收敛能力。

Original: https://blog.csdn.net/MR_kdcon/article/details/123518292
Author: Ton10
Title: 超分之EDSR

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624896/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python的pandas的stack和unstack函数的使用及区别

版权声明：转载请注明作者（独孤尚良dugushangliang）出处：https://blog.csdn.net/dugushangliang/article/details/11…

人工智能 2023年7月8日
0081
基于Hadoop + Hive框架进行电子商务数据分析的设计与实现

摘要随着大数据时代的到来，企业挖掘出隐藏巨大的数据价值给带来了更多的市场机会。大数据存储，处理和处理的研究已是企业未来发展的趋势，因此，将开展基于Hadoop + Hive框架进…

人工智能 2023年7月15日
0062
anaconda+tensorflow2.6.0详细一步一步安装

一、匹配版本安装这些大家懂的，需要想好版本以及版本对应，详细的可以百度查看。这里只解释tf2.6.0版本对应的东东。这个是目前截止今天最新的版本。发行于： 1、这里可以查看自己电…

人工智能 2023年6月16日
0077
海边溺水，救援机器人“生死时速”；机器学习论文撰写清单；Kaggle数据科学新手教程；约克大学『计算机视觉』课程资料；前沿论文 | ShowMeAI资讯日报

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点…

人工智能 2023年5月28日
0057
Mac m1芯片anaconda上安装tensorflow

Mac M1芯片上安装tensorflow 背景环境：Mac OS M1芯片，anaconda按照常规经验，在我的电脑上用用pip install TensorFlow之后，安装…

人工智能 2023年5月23日
00124
数据科学学习之统计实验的设计、检验与分析

专栏/前文链接本文为《数据分析与数据科学》专栏中的第三篇，专栏的链接在这里. 第一篇博文的链接在这里. 第二篇博文的链接在这里. 希望本文与此专栏能够对接触，学习和研究数据科学的…

人工智能 2023年7月18日
0044
如何在 Python 中计算 MAPE

平均绝对百分比误差 (MAPE) 通常用于衡量模型的预测准确性。计算如下： MAPE = (1/n) * Σ(|实际 – 预测| / |实际|) * 100 在哪里： …

人工智能 2023年7月5日
0043
GPT系列-1-ChatGPT的理解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月31日
0044
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师历史笔试详解

百度：机器学习/数据挖掘工程师/自然语言处理历史笔试题为了准备2023届毕业生的秋招汇总的网上分享的题目，自己进行的解析整理 1、用于多分类任务的激活函数 Softmax 2、…

人工智能 2023年7月17日
0068
第四课首次会话

一、输出和输入通过前两次课，我们已经准备好了Python环境并且也安装好了Python编辑器，这次我们就正式开始Python语言的学习吧。首先要了解一个概念，那就是什么叫输出和…

人工智能 2023年6月26日
0063
窗口函数深度探索（一）：底层原理

前言在日常SQL数据分析中，经常会遇到需要在每组内排名，面对这类需求就需要使用sql的高级功能窗口函数了。一言以蔽之：在进行分组聚合以后，我们还想操作集合之前的数据就需要用…

人工智能 2023年7月16日
0083
OpenCV4.3 Java 编程入门：灰度映射

文章目录 1 灰度与灰度映射 2 映射函数 3 图像求反 4 动态范围压缩 5 阶梯量化一幅灰度图像的视觉效果取决于该图像中各个像素的灰度，灰度映射通过改变图像中所有或部分图像的…

人工智能 2023年7月19日
0084
基于图像的数据增强方法发展现状综述

基于图像的数据增强方法发展现状综述人工智能技术与咨询 2022-03-22 20:57 点击蓝字 · 关注我们来源：《计算机科学与应用》，作者冯晓硕等关键词: 数据增强；…

人工智能 2023年7月9日
0095
一图看懂DeepSORT整个大流程，多目标跟踪

目录系列文章简介 DeepSORT流程图名词解释整体流程重点节点解释系列文章【目标跟踪】卡尔曼滤波器(Kalman Filter) 含源码【目标跟踪】一图看懂Dee…

人工智能 2023年6月15日
0071
【原创】人工客服会话日志挖掘论文调研

在人工客服服务日志中抽取问答对，配置到机器人知识库中 QA matching：以question为出发点，即假设question已经确定，从上下文(主要是上文)中找到该questi…

人工智能 2023年5月30日
0069
Python的numpy库中求数组中位数和平均值numpy.median()和numpy.mean()

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要Python的numpy库中求数组中位数和平均值的函数P…

人工智能 2023年7月6日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

超分之EDSR

Enhanced Deep Residual Networks for Single Image Super-Resolution

3.1 Residual blocks

; 3.2 Single-scale model

3.3 Multi-scale model

4.1 Datasets

4.2 Training Details

4.3 Geometric Self-ensemble

4.4 Evaluation on DIV2K Dataset

; 4.5 Benchmark Results

大家都在看