UNet++学习笔记（主干网络+代码）

2023年5月26日上午9:59 • 人工智能 • 阅读 85

论文

1 Abstract

文章提出，UNet主要有以下两大缺陷：

① 网络最优的深度未知，需要通过大量的实验以及集成不同深度的网络，效率低；

② skip connection引入了不必要的限制，即限制仅在相同的尺度进行特征融合。

对此，UNet++进行了以下的优化：

① 利用不同深度UNet的有效集成（这些UNet共享一个编码器），通过监督学习来搜索最优深度；

② 重新设计skip connection，使得解码器的子网络可以聚合不同尺度的特征，更加灵活；

③ 利用剪纸技术来提高UNet++的推理速度。

; 2 Introduction

传统的编码器解码器结构 + skip connection结构可以很好的应用于语义分割任务，原因是： 其将编码器子网中的浅层细粒度信息与解码器子网中的深层粗粒度信息进行相结合。

文章的五个贡献：

① UNet++内嵌了不同深度的UNet，从而不再是固定的深度结构；

② 更加灵活的skip connection结构，不再是仅融合同一尺度的特征；

③ 设计了一个剪枝操作加快推理速度；

④ 同时训练内嵌的不同深度的UNet引发了UNet之间的协同训练，带来了更好的性能；

⑤ 展现了可扩展性。

3 Backbone

3.1 Motivation

实验发现，更深的UNet不一定更好，因此进行了多组的消融实验。

在UNete中，需要同时对X01，X02，X03和X04赋予损失函数，从而让内嵌的UNet可以回传梯度。在UNet+到UNet++的过程中，从短连接到长连接，更加有效地利用了多种特征。

; 3.2 Structure

3.3 Deep supervision

; 3.4 Model pruning

集成模式，其中收集所有分割分支的分割结果，然后取其平均值；
剪枝模式，分割分支，其选择决定了模型修剪的程度和速度增益，例如上图。

以下参考：研习U-Net – 知乎 (zhihu.com)

; 代码


class VGGBlock(nn.Module):
    def __init__(self, in_channels, middle_channels, out_channels):
        super().__init__()
        self.relu = nn.ReLU(inplace=True)
        self.conv1 = nn.Conv2d(in_channels, middle_channels, 3, padding=1)
        self.bn1 = nn.BatchNorm2d(middle_channels)
        self.conv2 = nn.Conv2d(middle_channels, out_channels, 3, padding=1)
        self.bn2 = nn.BatchNorm2d(out_channels)

    def forward(self, x):
        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)

        return out

class NestedUNet(nn.Module):
    def __init__(self, num_classes, input_channels=3, deep_supervision=False, **kwargs):
        super().__init__()

        nb_filter = [32, 64, 128, 256, 512]

        self.deep_supervision = deep_supervision
        self.pool = nn.MaxPool2d(2, 2)
        self.up = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)

        self.conv0_0 = VGGBlock(input_channels, nb_filter[0], nb_filter[0])
        self.conv1_0 = VGGBlock(nb_filter[0], nb_filter[1], nb_filter[1])
        self.conv2_0 = VGGBlock(nb_filter[1], nb_filter[2], nb_filter[2])
        self.conv3_0 = VGGBlock(nb_filter[2], nb_filter[3], nb_filter[3])
        self.conv4_0 = VGGBlock(nb_filter[3], nb_filter[4], nb_filter[4])

        self.conv0_1 = VGGBlock(nb_filter[0] * 1 + nb_filter[1], nb_filter[0], nb_filter[0])
        self.conv1_1 = VGGBlock(nb_filter[1] * 1 + nb_filter[2], nb_filter[1], nb_filter[1])
        self.conv2_1 = VGGBlock(nb_filter[2] * 1 + nb_filter[3], nb_filter[2], nb_filter[2])
        self.conv3_1 = VGGBlock(nb_filter[3] * 1 + nb_filter[4], nb_filter[3], nb_filter[3])

        self.conv0_2 = VGGBlock(nb_filter[0] * 2 + nb_filter[1], nb_filter[0], nb_filter[0])
        self.conv1_2 = VGGBlock(nb_filter[1] * 2 + nb_filter[2], nb_filter[1], nb_filter[1])
        self.conv2_2 = VGGBlock(nb_filter[2] * 2 + nb_filter[3], nb_filter[2], nb_filter[2])

        self.conv0_3 = VGGBlock(nb_filter[0] * 3 + nb_filter[1], nb_filter[0], nb_filter[0])
        self.conv1_3 = VGGBlock(nb_filter[1] * 3 + nb_filter[2], nb_filter[1], nb_filter[1])

        self.conv0_4 = VGGBlock(nb_filter[0] * 4 + nb_filter[1], nb_filter[0], nb_filter[0])

        if self.deep_supervision:
            self.final1 = nn.Conv2d(nb_filter[0], num_classes, kernel_size=1)
            self.final2 = nn.Conv2d(nb_filter[0], num_classes, kernel_size=1)
            self.final3 = nn.Conv2d(nb_filter[0], num_classes, kernel_size=1)
            self.final4 = nn.Conv2d(nb_filter[0], num_classes, kernel_size=1)
        else:
            self.final = nn.Conv2d(nb_filter[0], num_classes, kernel_size=1)

    def forward(self, x):

        x0_0 = self.conv0_0(x)
        x1_0 = self.conv1_0(self.pool(x0_0))
        x0_1 = self.conv0_1(torch.cat([x0_0, self.up(x1_0)], 1))

        x2_0 = self.conv2_0(self.pool(x1_0))
        x1_1 = self.conv1_1(torch.cat([x1_0, self.up(x2_0)], 1))
        x0_2 = self.conv0_2(torch.cat([x0_0, x0_1, self.up(x1_1)], 1))

        x3_0 = self.conv3_0(self.pool(x2_0))
        x2_1 = self.conv2_1(torch.cat([x2_0, self.up(x3_0)], 1))
        x1_2 = self.conv1_2(torch.cat([x1_0, x1_1, self.up(x2_1)], 1))
        x0_3 = self.conv0_3(torch.cat([x0_0, x0_1, x0_2, self.up(x1_2)], 1))

        x4_0 = self.conv4_0(self.pool(x3_0))
        x3_1 = self.conv3_1(torch.cat([x3_0, self.up(x4_0)], 1))
        x2_2 = self.conv2_2(torch.cat([x2_0, x2_1, self.up(x3_1)], 1))
        x1_3 = self.conv1_3(torch.cat([x1_0, x1_1, x1_2, self.up(x2_2)], 1))
        x0_4 = self.conv0_4(torch.cat([x0_0, x0_1, x0_2, x0_3, self.up(x1_3)], 1))

        if self.deep_supervision:
            output1 = self.final1(x0_1)
            output2 = self.final2(x0_2)
            output3 = self.final3(x0_3)
            output4 = self.final4(x0_4)
            return [output1, output2, output3, output4]

        else:
            output = self.final(x0_4)
            return output

Original: https://blog.csdn.net/Leon_____/article/details/123311170
Author: 别码了W哥
Title: UNet++学习笔记（主干网络+代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519089/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语音识别插件_语音识别技术，将语音转换为文本

现在越来越多的同学不想打字，而选择用语音来取代文字的输入，现在也已经有很多的语音识别技术了，逐渐成熟强大，完全可以应用在日常的生活中。很多的技术公司也努力把这种语音识别技术应用在…

人工智能 2023年5月25日
0089
西瓜书学习笔记—第三章线性模型

目录一、题目要求二、数据集介绍三、Logistics回归模型 3.1 Logistics回归模型介绍 3.2 Logistics回归算法原理 3.3 Logistics回归算…

人工智能 2023年6月17日
00104
pycharm调用GPU

使用pycharm调用CUDA 首先在pycharm中使用device是否具有gpu * 在设备管理器中查看自己的gpu 下载显卡驱动首先在pycharm中使用device是否具…

人工智能 2023年7月6日
00106
机器学习笔记10 — 回归与聚类算法

回归和聚类[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is sto…

人工智能 2023年6月2日
0089
Vision Transformer(ViT)——PyTorch实现

文章目录 * – 1. 导入库 – 2. Patches Embeddings – + 2.1 CLS Token + 2.2 Position…

人工智能 2023年7月22日
0067
【软件测试从0到1】第三篇：用例篇

目录一、测试用例的基本要素二、测试用例的设计方法三、具体的设计方法 3.1 等价类 3.2 边界值 3.3 判定表法 3.4 正交法 3.5 场景设计法 3.6 错误猜测法 …

人工智能 2023年6月27日
00104
语音助手——评测指标

一个语音助手包含很多模块和环节，比如ASR、NLU、TTS、客户端等，那么如何评估一个语音助手以及其各个模块的效果呢？有没有可以量化的指标？ 1 、产品指标：用户对话数：指每天的…

人工智能 2023年5月25日
0080
openCV学习之路（2-4）—深度解析cvtColor函数

代码如下： #include #include #include #include using namespace cv; using namespace std; int mai…

人工智能 2023年7月20日
0052
2021研电赛获奖作品合集

2021″兆易创新杯”第十六届研究生电子设计竞赛（以下简称”研电赛”）已经结束，在比赛中出现了很多优秀作品，特作为整理获奖情况：全…

人工智能 2023年5月25日
00101
【Python 初学者】从零开始构建自己的神经网络

此图为使用神经网络预测猫狗案例。原创：CSDN/知乎：川川菜鸟文章目录 * – 什么是神经网络？ – 训练神经网络 – 前向传播 &#8211…

人工智能 2023年7月30日
0054
论文阅读：《PETR: Position Embedding Transformation for Multi-View 3D Object Detection》

图1 NuScences纯视觉3D检测榜单 (2022.3.18) 这篇论文对应NuScenes纯视觉榜三方法PETR，旷视科技于2022年3月上传至arXiv。PETR是DET…

人工智能 2023年7月9日
0062
统计学习基础——第七章非线性模型

目录一、多项式回归 1、定义（1）特点（2）与线性回归模型的异同二、阶梯函数 1、定义 2、作用 3、与分段函数区别 4、步骤三、基函数 1、原理四、回归样条 1、分段…

人工智能 2023年6月17日
0080
STM32F334高分辨率定时器寄存器描述

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0088
流聚类算法之CluStream

CluStream 前言一、CluStream算法的切入点二、CluStream算法核心思想三、CluStream算法的两阶段 * 3.1 在线阶段 3.2 离线阶段 Clu…

人工智能 2023年6月2日
0083
PYTHON+YOLOV5+OPENCV，实现数字仪表自动读数，并将读数结果进行输出显示和保存

最近完成了一个项目，利用python+yolov5实现数字仪表的自动读数，并将读数结果进行输出和保存，现在完成的7788了，写个文档记录一下，若需要数据集和源代码可以私信。最后…

人工智能 2023年7月4日
0083
K-Means聚类实验报告实例

1. 实验背景与问题提出 PS：寒假接高数辅导，操作系统辅导，数据结构辅导，有需要者评论或私信聚类（clustering）是无监督学习（unsuperviserd learnin…

人工智能 2023年5月31日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31