深度学习零基础学习之路——第四章 UNet-Family中Unet、Unet++和Unet3+的简介

2023年10月24日上午9:05 • Python • 阅读 85

Python深度学习入门

第一章 Python深度学习入门之环境软件配置
 第二章 Python深度学习入门之数据处理Dataset的使用
 第三章数据可视化TensorBoard和TochVision的使用
 第四章 UNet-Family中Unet、Unet++和Unet3+的简介
 第五章个人数据集的制作

Unet-Family的学习

Python深度学习入门
前言
一、FCN全卷积网络模型
二、Unet编码模型
三、Unet++模型
四、Unet3+模型
*
4.1、改进的跳跃连接（全尺度跳跃连接）
4.2 全尺度深度监督
4.3 分类指导模块(Classification-guided Module，CGM)
五、总结

前言

最近学习了Unet、Unet++和UNet3+模型，并且对这三者进行了一些研究，并将其作为组会上报告的内容，效果还是不错，因此趁自己还记得一些，写一个博客记录一下，方便后续复习，不得不说Unet模型还是很强大的，也难怪Unet模型现在很火，值得一学。

一、FCN全卷积网络模型

FCN网络模型全称为全卷积神经网络模型(Fully Convolution Network)，该模型是2015年由Jonathan Long等人在一篇论文《Fully Convolutional Networks for Semantic Segmentation》中提出的语义分割模型。该模型算得上是深度学习用于语义分割领域的开山之作，在后续的语义分割模型中都可以看到FCN模型的影子。其模型结构和CNN非常相像，因此该模型也算是卷积神经网络CNN的升级

深度学习零基础学习之路——第四章 UNet-Family中Unet、Unet++和Unet3+的简介

FCN核心思想：
1、将CNN的全连接层换成了卷积层，这样FCN就适应任何尺寸的图片输入，也可以使得网络输出是一个热度图（heatmap），而非单个类别标签。
2、加入上采样操作(反卷积) ，将卷积得到的feature map上采样到原图大小，然后这样就可以做像素级别的分类，这样就可以将分割任务变成了分类问题。
3、采用跳跃连接，即在上采样过程中加入不同深度的feature map。这样既可以将下采样过程中丢失的细节数据补全，又保留了原始图像的空间信息，使得模型具备更高的精度与鲁棒性。这样就是为什么FCN网络模型有FCN32、FCN16、FCN8，如下图.

; 二、Unet编码模型

FCN模型的提出成为了深度学习解决分割问题的奠基石。但Unet模型的提出可以说是将深度学习解决分割问题推上了一个新的高度。论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》中的Unet模型是与FCN同年2015年提出来的，但其还是晚于FCN。Unet模型可以算是医学图像分割领域的领头者，其也是通过下采样获取特征图，然后再上采样还原到原图，但Unet模型有很多独特的地方，正因这些特点才使得U-Net网络模型到现在还如此火热。

U-Net模型独特之处：

1、模型结构完全对称：
U-Net模型的结构完全异于CNN和FCN，左半边下采样，右半边进行对等的上采样。

2、 采用编码和解码结构(Encoder-Decoder)：
1)Encoder：编码器整体呈现逐渐缩小的结构，不断缩小特征图的分辨率，以捕获上下文信息。编码器共分为4个阶段，在每个阶段中，使用最大池化层进行下采样，然后使用两个卷积层提取特征，最终的特征图缩小了16倍；
2)Decoder：解码器呈现与编码器对称的扩张结构，逐步修复分割对象的细节和空间维度，实现精准的定位。解码器共分为4个阶段，在每个阶段中，将输入的特征图进行上采样后，与编码器中对应尺度的特征图进行拼接运算，然后使用两个卷积层提取特征，最终的特征图放大了16倍；

3、U-Net式的跳跃连接(skip connection)：
该处的跳跃链接的作用和FCN处的跳跃连接作用是一样的，都是为了使得上采样恢复的特征图中包含更多low-level的语义信息，使得结果的精细程度更好。但它叫U-net式的跳跃连接是为了区分FCN式的跳跃连接，其区别在于Unet式的跳跃连接是 channel维度的拼接融合，而FCN式的跳跃连接只是 对应像素点的简单加和。

U-Net模型各方面看起来是很好，但是我学到这里的时候就心中有很多疑问疑问了：

U-Net模型一定要按论文中的模型一样下采样四次才叫U-Net模型吗？
下采样对于分割网络是不是必须执行的呢？
上采样必须要等到下采样结束才可以开始上采样吗？

这些疑惑终于在UNet++网络模型的提出者写的一篇博客中解开了。链接：https://zhuanlan.zhihu.com/p/44958351。

1、U-Net模型一定要按论文中的模型一样下采样四次才叫U-Net模型吗？
答：我个人觉得这个说法是不正确的，U-Net模型应该指的是一种思想，一种架构，如将Encoder-Decoder结构运用到模型中、模型结构完全对称、采用U-Net式的跳跃连接等等，我们不应该拘束于用什么卷积，用几层，怎么降采样，学习率多少，优化器用什么，这些都是比较直观的参数，其实这些在论文中给出参数并不见得是最好的，所以关注这些的意义不大。

2、下采样对于分割网络是不是必须执行的呢？
答：我们先要了解下采样的作用是可以增加对输入图像的一些小扰动的鲁棒性，比如图像平移，旋转等，减少过拟合的风险，降低运算量，和增加感受野的大小。如果图片比较小、颜色、对象比较单一、很容易提取特征，下不下采样对于模型的预测影响不大的话，何必折腾下采样再上采样呢？

3、上采样必须要等到下采样结束才可以开始上采样吗？
答：这个问题我们可以这样理解，分别将U-Net模型下采样1次、2次、3次开始上采样会得到什么效果，一层、两层、三层、四层的Unet模型，这样我们就可以知道这个问题的答案了吧。

Unet的不足之处就在于它仅有同层之间的连接，上下层存在 信息代沟现象。

; 三、Unet++模型

U-net++模型顾名思义就是U-Net模型的升级版，它出自论文《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》，它既融合了Unet模型的结构思想，也解决了Unet模型存在的不足。作者当时就在想，既然Unet模型不一定要下采样四次才是最佳的，那下采样多少次才是做好呢？作者就进行了不同层模型对比实验(如下图)，实验表明最佳的模型结构因数据集的不同而不同。

但是模型中间的X0,1，X0,2，X0,3，X1,1，X1,2，X2,1节点因与最后计算损失值的函数LossFunction是断开的，导致模型在训练过程中的反向传播无法到达，进而导致模型无法训练。针对这个问题，有两种解决方式：

在模型的中间节点之间增加短连接，让模型训练过程中的反向传播可以到达每个节点。
将节点==X0,1X0,2X0,3,X0,4==后面加个1×1的卷积核，然后再与计算损失值的函数LossFunction相连去监督每个level的输出 (这也是Unet++的一个重要特点，深度监督Deep Supervision)，这样整个模型就类似于是1、2、3、4层U-Net模型的叠加了。

U-Net++的创新点：

1、加入深度监督(Deep Supervision)：
深度监督就是在每一层的末尾添加一个1×1的卷积核，然后再与计算损失值的损失函数LossFunction相连，这样有什么好处呢？
1)使模型更加完整，解决了模型反向传播时无法到达的情况。
2)使模型可以进行剪枝操作，因为我们Unet++模型融合了不同层的Unet模型，在测试的过程中模型太过大会影响测试效率。但是在测试过程中输入的图像只会前向传播，因此对于小图片的测试时扔掉深层部分模型对前面的输出完全没有影响的。但在训练阶段，因为既有前向，又有反向传播，被剪掉的部分是会帮助其他部分做权重更新的。所以加入剪枝操作可以提升模型的测试速度，这也是有实验证明了的。

2、 多尺度跳跃连接：
可以抓取不同层次的特征,将它们通过特征叠加的方式整合，不同层次的特征，或者说不同大小的感受野，对于大小不一的目标对象的敏感度是不同的，比如，感受野大的特征，可以很容易的识别出大物体的，但是在实际分割中，大物体边缘信息和小物体本身是很容易被深层网络一次次的降采样和一次次升采样给弄丢的，这个时候就可能需要感受野小的特征来帮助.而UNet++就是拥有不同大小的感受野,所以效果好.

好吧，这个模型又经过其他大佬修改提出了U-Net3+模型，Unet++存在的不足就是增加了模型的参数量，从模型结构就可以看出，它比Unet多了很多中间节点；其次就是它缺乏全尺度探索足够信息的能力，即低层模型结构没有加入深层特征图的内容。这也就是UNet3+的创新点。

; 四、Unet3+模型

Unet3+根据Unet++的不足一一进行了改进，它的创新点就是Unet++存在的不足。

4.1、改进的跳跃连接（全尺度跳跃连接）

无论是连接简单的UNet，还是连接紧密嵌套的UNet++，都缺乏从全尺度探索足够信息的能力，未能明确了解器官的位置和边界。而Unet3+就去掉了Unet++的稠密卷积块，而是提出了一种全尺寸跳跃连接。全尺寸跳跃连接改变了编码器和解码器之间的互连以及解码器子网之间的内连接，让每一个解码器层都融合了来自编码器中的小尺度和同尺度的特征图，以及来自解码器的大尺度的特征图，这些特征图捕获了全尺度下的细粒度语义和粗粒度语义。

; 4.2 全尺度深度监督

Unet3+的全尺度深度监督与UNet++中的深度监督不同之处在于监督的位置不同，前者监督的是网络解码器每个阶段输出的特征图，后者监督的是网络第一层中的四张特征图（其中三张为跳跃连接中卷积块的输出特征图，一张为解码器最后输出的特征图）。此外，在UNet3+中，为了实现深度监督，每个解码器阶段的最后一层被送入一个普通的3×3卷积层，然后是一个双线性上采样和一个sigmoid函数（这里的上采样是为了放大到全分辨率）。

4.3 分类指导模块(Classification-guided Module，CGM)

该模块的提出是为了解决医学图像分割过程中非器官图像出现假阳性的现象(意思就是输入一张没有目标器官的图像，经过模型测试，结果显示存在目标器官的假象)。这个分类指导模块就是将模型的最深层经过dropout，卷积，sigmoid等一系列的操作之后得到一个是否有目标器官的概率，再通过Argmax函数的帮助下得到一个{0，1}的单个输出，进而指导每一个切分侧边的输出。

U-Net3+的创新点：

1、降低了模型参数量，模型结构更加简洁：
Unet++模型虽然较Unet模型融入了更多特征信息，使模型更加精准，但其也增加了网络结构的参数量，导致模型训练和运行速度降低了很多。而UNet3+不仅保留了Unet++的优秀特性，还删除了中间节点减少了模型参数量，使模型结构更加简洁。

2、 全尺度跳跃连接：
全尺寸跳跃连接改变了编码器和解码器之间的互连以及解码器子网之间的内连接，让每一个解码器层都融合了来自编码器中的小尺度和同尺度的特征图，以及来自解码器的大尺度的特征图，这些特征图捕获了全尺度下的细粒度语义和粗粒度语义。

３、 分类指导模块：
分类指导模块给模型又提供了一个参考对象，通过该模块可以避免因噪声数据和过度分割导致的假阳现象。

; 五、总结

UNet是一个经典的网络设计方式，在图像分割任务中具有大量的应用。也有许多新的方法在此基础上进行改进，融合更加新的网络设计理念，但目前几乎没有人对这些改进版本做过比较综合的比较。由于同一个网络结构可能在不同的数据集上表现出不一样的性能，在具体的任务场景中还是要结合数据集来选择合适的网络。

Original: https://blog.csdn.net/Monkey_King_GL/article/details/127820469
Author: Monkey_King_GL
Title: 深度学习零基础学习之路——第四章 UNet-Family中Unet、Unet++和Unet3+的简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/804233/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

粒子群优化算法（PSO）

粒子群优化算法（PSO）粒子群优化算法（PSO）是一种进化计算技术，源于对鸟群捕食行为的研究。该算法最初是受到飞鸟集群活动的规律性启发，进而利用群体智能建立的一个简化模型。粒子群…

Python 2023年8月1日
0068
IOS逆向案例 xxx义

1.脱壳 https://www.cnblogs.com/pythonywy/p/15919313.html 2.抓包 http://xxxx.xxxx.xxxx//v1/home…

Python 2023年6月15日
0081
【无敌Python 】增强视频画质，就应该这么做

原理不知道大家小时候有没有玩过这个？最早的动画就是这么形成的，记得小时候还有这种小书卖。其实视频的原理也是这样，一个视频是由很多张图片组成的，一个图片是一帧。所以我们要对视频…

Python 2023年11月2日
0021
文档字符串

5.5 文档字符串开发者在编写函数或模块时不光要自己能看懂，在和他人合作共同开发或者被他人调用时也需要他人也能看懂。这个时候就可以为自己编写的函数、模块或者类添加相应的文档字符串…

Python 2023年10月29日
0036
Python自学教程12-类和对象怎么用

Python是一门现代化的编程语言，也是一门面向对象的编程语言。现代编程语言几乎都支持面向对象编程，面向对象编程是最有效的软件编写方法之一。你可以用类和对象来表示现实当中的任何的…

Python 2023年10月23日
0037
【Flask】总结静态文件及渲染模板的使用

动态的 web 应用同样需要静态文件。 CSS 和 JavaScript 文件通常来源于此。理想情况下，你的 web 服务器已经配置好为它们服务，然而在开发过程中 Flask 就…

Python 2023年8月13日
0055
使用VMware安装Ubuntu虚拟机

一、下载安装VM软件这一步跳过，因为网上都能找到下载地址，下载后一步一步的安装即可，网上也有很多下载地址，这里提供一个Windows的下载链接。链接: https://pan….

Python 2023年6月9日
0060
【学习笔记】爬虫框架Scrapy入门

一. Scrapy简介、架构、数据流和项目结构二. Scrapy入门 1. Scrapy架构由哪些部分组成？ 1.1 Scrapy简介 Scrapy是:由Python语言开发的一…

Python 2023年10月3日
0039
反常积分敛散性的比较判别法专题（及常用反常积分）

反常积分敛散性的比较判别法文章目录 1.比较判别法的一般形式 2.比较判别法的极限形式 3.常用结论 * ①常用反常积分一（p积分） ②常用反常积分二(q积分) ③常用反常积分三…

Python 2023年9月28日
0075
驱动编程简单教程——PTC512（ADC芯片驱动）为例

1.简介上几周硬件找了一个ADC芯片的替代料，需要我这边写一个驱动做测试。以前都是配置与修改设备树，最多查看或小改一下驱动，没有写过驱动，所有记录一下思路。大致思路就是先看原理图…

Python 2023年11月7日
0036
unittest 测试框架与 pytest 测试框架区别对比优劣分析

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年9月13日
0044
人脸口罩监测系统

1 .1 设计背景及意义受新冠疫情影响，公民外出时极易感染或传播新冠病毒，尤其是在公共场所，病毒的传播率更是大幅提高。为防止公民感染新冠病毒，降低病毒的传播率，因此规定，公民出入…

Python 2023年9月27日
0046
django部署到Apache踩过的坑

部分教程只是说需要在Apache 的配置文件httpd.conf 中写 LoadModule wsgi_module modules/mod_wsgi.so实际上这个modules…

Python 2023年8月5日
0049
【Java并发入门】02 Java内存模型：看Java如何解决可见性和有序性问题

如何解决其中的可见性和有序性导致的问题，这也就引出来了今天的主角——Java 内存模型。一、什么是 Java 内存模型？因此，解决方案是：提出一套规则和方法，是程序员能在该…

Python 2023年10月13日
0035
Python数据分析-pandas基础-2-DataFrame基础操作

1.基础索引方式 import pandas as pd df=pd.DataFrame({‘col1′:[1,2,3,4,5],’col2’:[6,7,8,9,0]}) df &…

Python 2023年8月7日
0050
02 pandas入门

目录 1. pandas数据结构介绍 1.1 Series 1.2 DataFrame 1.3 索引对象 2. 基本功能 2.1 重建索引 2.2 轴向上删除条目 2.3 索引、选…

Python 2023年8月27日
0044

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30