图像分割UNet系列——Attention Unet详解

2023年7月13日下午1:51 • 人工智能 • 阅读 71

图像分割unet系列——Attention Unet详解

*
– 1、Attention Unet主要目标
– 2、Attention Unet网络结构
– 3、Attention Gate的本质
– 4、关于Attention Unet的思考

Attention Unet发表于2018年中期（比Res-UNet要早一些），它也是UNet非常重要的改进版本之一。当然，Attention Unet同样也是应用在医学图像分割领域，不过文章主要是以胰脏图像分割进行实验与论证的。

1、Attention Unet主要目标

作者在摘要与简介中很清楚的表明了要解决的问题以及要达到的目标。具体如下所示：

抑制输入图像中的不相关区域，同时突出特定局部区域的显著特征；
用soft-attention 代替hard-attention的思路（注意：sorf-attention可微，可以微分的attention就可以通过神经网络算出梯度并且前向传播和后向反馈来学习得到attention的权重）；
集成到标准UNet网络结构中时要简单方便、计算开销小，最重要的是提高模型的灵敏度和预测的精度；

2、Attention Unet网络结构

将 Attention融入到UNet的结构如下图1所示：

Attention Gate(AG) 的具体结构如下图2所示：

结合图1与图2可以很清楚的了解到Attention UNet网络结构的主要特点。从图1可以很清楚的看到解码部分feature map与其上一层的编码部分feature map作为AG的输入，经过AG后将结果cat上采样的解码部分feature map。下面我们根据图2详细讲一下GA操作。

首先，g g g与 x l x^{l}x l进行并行操作，g g g通过W g W_{g}W g 得到A， x l x^{l}x l通过W x W_{x}W x 得到B，随后进行A+B操作得到C。注意一点：g g g来自于 x l x^{l}x l下一层，尺寸大小是 x l x^{l}x l的1/2，所以要对 x l x^{l}x l进行下采样（当然也可以对g g g进行上采样）。否则由于尺寸问题A与B不可能可以进行逐点”+”操作。从下面的Relu操作的维度可以看到，很明显是对 x l x^{l}x l进行下采样（应该主要是考虑到计算开销问题）。

然后，C进行了Relu操作得到D，D进行ψ \psi ψ操作得到E。E进行sigmoid 操作得到F，F通过resampler（重采样）得到注意力系数α \alpha α（注意力系数其实是注意力权重）。

最后，注意力系数α \alpha α乘以 x l x^{l}x l得到x ^ l \widehat{x}^{l}x l。

; 3、Attention Gate的本质

注意力机制的本质是什么样的呢？AG是如何做到提高局部（感兴趣区域ROI）特征抑制某些非感兴趣区域的呢？我自己根据自己的理解做一个简要的说明，不对的地方希望各位大神和同学们指正。

在上一节中讲到g g g与 x l x^{l}x l进行卷积操作后得到A和B，然后相加得到C，假设他们的特征图分别如下所示，并表示这个过程。

从上图也可以看出，g g g与 x l x^{l}x l进行卷积操作后的A、B为什么要有相同的尺寸大小，否则无法进行加运算。我们从C中也可以看出，A+B实际上将相同的感兴趣区域的信号加强了（红色部分），各自不同的区域（绿色区域）也在其中作为辅助或是补充存在在C中（这样其实也保存了一定的回旋余地）。

从C到α \alpha α的过程如下所示（假设α \alpha α得到的结果如下图），从图中也可以看到，我认为得到的应该是一个注意力权重，以便于与x l x^{l}x l进行点对点的相乘。从而不断提高局部ROI的权重抑制非ROI部分。

作者也在论文中给出了不断迭代过程中Attention Gate的效果，在3、6、10和150个epoch时，其中红色突出显示较高的注意力。随着训练的进行，网络学会了专注于期望的区域。具体效果如下图所示：
图像分割UNet系列------Attention Unet详解

4、关于Attention Unet的思考

上次讲解的Res-UNet中同样也存在Attention模块，但是与Attention Unet相比，这两个Attention的方法是完全不同的。Res-UNet本质上是hard-attention，而Attention Unet本质上是soft-attention。
从Attention效果上看，Res-UNet的Attention关注的是整个视网膜部分，并没有对血管部分（局部ROI）进行attention操作，而Attention Unet是对局部ROI进行的操作。

从应对复杂场景来看，Res-UNet的Attention在较复杂的场景中（比如腹部CT）很难通过二值化操作得到正确的Mask。但是反观Attention Unet，通过sorf-attention的方法可以逐步加强局部ROI的权重，有效抑制无关区域中的激活，减少冗余的部分的skip。从这方面看，Attention Unet拥有更为广阔的应用范围。

从网络结构的设计角度看，Attention Unet相对于Res-UNet更为复杂一些。但是具体问题具体分析，包括其他UNet改进算法，适合自己项目的才是最好的。

Original: https://blog.csdn.net/guzhao9901/article/details/119612308
Author: gz7seven
Title: 图像分割UNet系列——Attention Unet详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689940/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

最新 CCF A 类人工智能会议论文下载汇总 (含2022)

2023年部分 CCF A 类会议论文下载地址汇总 2022年部分 CCF A 类会议论文下载地址汇总 2021年部分 CCF A 类会议论文下载地址汇总 2020 年前部分 CC…

人工智能 2023年5月28日
0078
NLP中的BPE（byte pair encoding）分词算法

本篇博客的算法来源的论文是 Neural Machine Translation of Rare Words with Subword Units，感兴趣的读者可以自行在Googl…

人工智能 2023年5月30日
0082
软件工程毕业设计课题（60）微信小程序毕业设计JAVA共享充电桩小程序系统设计与实现

项目背景和意义目的：本课题主要目标是设计并能够实现一个基于微信共享充电桩小程序系统，前台用户使用小程序，小程序使用微信开发者工具开发；后台管理使用基PHP+MySql开发，开发工…

人工智能 2023年6月28日
0061
【OpenCV 例程300篇】07. 图像的创建（np.zeros）

专栏地址：『youcans 的 OpenCV 例程 300 篇』【OpenCV 例程300篇】07. 图像的创建（np.zeros） OpenCV 中图像对象的数据结构是 nda…

人工智能 2023年6月19日
00110
Python pandas concat 连接参数详解用法数据拼接数据堆叠

; pd.concat 数据拼接、绑定或堆叠。一、参数详解 join_axes 已弃用，如果需要使用此功能，建议用 merge ; 二、实例代码 1. 简单拼接。 1.1 初始化…

人工智能 2023年7月9日
0065
听说某宝抢购脚本大家都会了？那就在来个某东茅台抢购脚本吧。

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月29日
0079
python pandas中groupby()的使用，sum和count

groupby[根据哪一列][对于哪一列]进行计算 groupby 中sum的使用（求和的作用）表格样式： import pandas as pd df = pd.DataFra…

人工智能 2023年7月5日
0068
语音识别研究方向

远场语音识别1）语音激活检测（VAD）需求背景：在近场识别场景，比如使用语音输入法时，用户可以用手按着语音按键说话，结束之后松开，由于近场情况下信噪比（signal to noi…

人工智能 2023年5月25日
0058
STATA长面板数据分析

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、面板数据基本概念二、STATA长面板数据分析步骤 * 1.数据导入与处理 2.描述性统计 3.单位…

人工智能 2023年7月14日
00208
百度语音合成模型Deep Voice3

INTRODUCTION Deep Voice3是由百度提出的一个全新的全卷积TTS架构。百度的主要工作分为如下五个方面：提出了一个全卷积的 character-to-spect…

人工智能 2023年5月27日
00215
wy的leetcode刷题记录_Day40

wy的leetcode刷题记录_Day40 声明本文章的所有题目信息都来源于leetcode如有侵权请联系我删掉目录 wy的leetcode刷题记录_Day40 * 声明 79…

人工智能 2023年6月29日
0061
机器学习【线性回归算法1】

文章目录一简介 * 1 应用场景 2 什么是线性回归 – 2.1 定义与公式 2.2 特征与目标的关系分析二 API初步使用三数学:求导 * 1 常见函数的导…

人工智能 2023年6月18日
0088
LabVIEW AI视觉工具包（非NI Vision）下载与安装教程

上一篇随笔如果以上链接下载不方便，可在文章末尾添加群，在群文件中下载相关工具包 1.CPU用户 2.GPU用户以上就是今天要给大家分享的内容。如果有问题可以在评论区里讨论，提问…

人工智能 2023年6月3日
00136
【C++】保存浮点型数值图像Mat文件的三种方法

近期遇到了需要将浮点型数据(float或double)存储在一张图中的问题，例如将图像中的某一像素对应于点云中的大地坐标XYZ，即仿照原图像RGB存储伪图像XYZ。忙活了几天研究了…

人工智能 2023年6月18日
0095
deeplabv3+——训练自己的数据集 torch1.12.0 cuda11.3

参考博客一、制作自己的数据集二、训练三、可视化 torch==1.12.0+cu113 cuda==11.3 显卡为 RTX3070ti tips：30系显卡最好还是用配套的…

人工智能 2023年6月25日
0066
读书笔记：深度学习入门-基于python的理论与实现（俗称鱼书）

文章目录前言三、神经网络 * 3.2 激活函数 – 3.2.1 阶跃函数 3.2.2 sigmoid函数 3.2.3 ReLU函数 3.3 多维数组 –…

人工智能 2023年6月16日
0096

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30