💡 Transposed Convolution，转置卷积，并不是卷积的逆运算，主要用于 upsampling。图像分割和图像生成等任务需要图像恢复到原尺寸，这个将图像由小分辨率映射到大分辨率的尺寸恢复操作，叫做上采样。 （待补充图像处理中常用的上采样操作，eg：最近邻插值、线性插值、双线性插值、双三次插值）

1. 运算步骤（s为步长，p为padding，k为卷积核尺寸）

在输入特征图元素 间填充s-1行，0列
在输入特征图 四周填充k-p-1行，0列
将卷积核参数上下、左右翻转
做正常卷积运算（padding0，stride1）

step1：元素间填充0行；step2：四周填充2行；

step3：卷积核参数上下左右反转；step4：正常卷积

转置卷积操作后特征图的大小可以通过如下公式计算：

其中stride[0]表示高度方向的stride，padding[0]表示高度方向的padding，kernel_size[0]表示高度方向的kernel_size，索引[1]都表示宽度方向上的。通过上面公式可以看出padding越大，输出的特征矩阵高、宽越小， 你可以理解为正向卷积过程中进行了padding然后得到了特征图，现在使用转置卷积还原到原来高、宽后要把之前的padding减掉。
原文链接：https://blog.csdn.net/qq_37541097/article/details/120709865

2. 优势以及不足

与传统的上采样方法相比，转置卷积具有可学习的参数，上采样方式并非预设的插值方法。可通过网络来获取最优的上采样方式
应用场景：
图像生成任务DCGAN中，生成器将随机输入变成一个全尺寸图片，这里用到了转置卷积
语义分割中，解码器中使用转置卷积，eg：FCN、UNet
CNN可视化，通过转置卷积将CNN的特征图还原到像素空间，以观察特定特征图对哪些模式的图像敏感
但是，转置卷积会导致生成图像中出现 *网格/棋盘效应（checkerboard artifacts）

膨胀卷积

💡 Diated convolution又叫做空洞卷积，在保持卷积参数量不变的情况下： ①增大卷积感受野；②保持原输入特征图长和宽不改变。
举个例子：VGG网络中，maxpooling下采样倍率太大， 丢失了细节信息，但去掉maxpooling层的话（pooling操作不可逆），导致特征图对应原图感受野减小， 无法重构小的物体图像。因此引入膨胀卷积。当然将普通的卷积stride步长设为大于1，也会达到增加感受野的效果，但是 stride大于1就会导致downsampling，图像尺寸变小（在先减小再增大尺寸的过程中，有一些信息损失掉）

1. Gridding Effect网格效应

eg：膨胀系数为2的3*3kernal经过多次叠加，会出现gridding effect（损失信息的连续性）

💡 解决办法：Hybrid Dilated Convolution (HDC) （类似于卷积设计的标准化）
叠加卷积的膨胀银子不能有大于1的公约数，eg：[2,4,6]会出现gridding effect
膨胀因子应设计成锯齿状结构，eg：[1,2,5,1,2,5]
最大膨胀因子应满足公式：

2. 小目标分割效果差

仅采用大 dilation rate 的信息或许 只对一些大物体分割有效果，而对小物体来说可能则有弊无利了。锯齿状本身的性质就比较好的来同时满足小物体大物体的分割要求(小 dilation rate 来关心近距离信息，大 dilation rate 来关心远距离信息)。

3. 膨胀卷积的一些特点

膨胀卷积与普通卷积的 相同点在于：卷积核的大小是一样的，在神经网络中即参数数量不变，区别在于膨胀卷积具有更大的感受野。
对比传统的conv操作，3层3×3的卷积加起来，stride为1的话，只能达到(kernel-1)layer+1=7的感受野，也就是和层数layer成线性关系，而 dilated conv的感受野是指数级*的增长。
适用情况：在图像需要 全局信息、语音文本需要较长的sequence信息依赖的问题中，都能很好的应用dilated conv。

FCN

💡 （CVPR 2015）首个端到端的针对图像分割（像素级预测）的 全卷积网络。主要将分类网络中的全连接层替换成卷积层。地位类比于目标检测中的Faster R-CNN。

原文链接：; Fully Convolutional Networks for Semantic Segmentation

1. 主要贡献

解决了输入大小尺寸限制问题（全连接层要求输入节点个数是固定的，所以分类网络中输入图片大小也是固定的，虽然后来有使用全局池化层来解决这个问题）
开创了语义分割的先河，实现了像素级别的分类预测（端到端）
技术上：全连接卷积化、跳跃连接、反卷积

DeepLabV1

DeepLabV2

DeepLabV3

LR-ASPP

UNet

U2Net

Original: https://blog.csdn.net/weixin_40629850/article/details/126492874
Author: TianleiShi
Title: 【语义分割】算法理论梳理：基础理论/常见网络FCN、DeepLab、LR-ASPP、UNet、U2Net

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/633367/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【多目标跟踪与计数】（三）DeepSORT实战车辆和行人跟踪计数

一、DeepSort介绍论文地址： https://arxiv.org/pdf/1703.07402.pdf 参考文章： DeepSort讲解代码地址： https://git…

人工智能 2023年6月23日
0098
tensorflow/keras使用GPU进行训练

原文 1 需要的环境配置 Anaconda环境，Anaconda安装教程 CUDA，CUDA下载，这里需要注意CUDA、cuDNN、tensorflow的对应版本，对应版本查询 c…

人工智能 2023年6月17日
0098
为什么要做数仓分层，不做行吗？

来源：数据社作者：数据一哥编辑：数据一哥全文共1404个字，建议阅读 4分钟大家好，我是一哥。今天跟大家聊一聊数仓为什么分层？ 01 经典的数仓分层首先跟大家聊一个经典…

人工智能 2023年6月11日
0073
MySQL数据库基本操作

目录一、SQL语句 (mysql 数据库中的语言) 二、DDL 1.DDL语句 (1)创建新的数据库 (2)创建新的表 2.删除数据库和表三、DML 1.insert插入新数据…

人工智能 2023年5月30日
0079
AI&BlockChain：“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理、区块链和爬虫技术的智能会议系统》软件系统案例的界面简介、功能介绍分享之总篇

AI&BlockChain：”知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理、区块链和爬虫技术的智能会议系统…

人工智能 2023年6月23日
0098
Amos界面介绍及模型构建

想要学习更多SPSS、AMOS、R等软件操作，请关注”数据分析成长记”微信公众号，更多精彩文章等你来读！ Amos界面介绍及模型构建结构化方程模型（简称S…

人工智能 2023年6月11日
00110
二手车估价问题浅析

问题一：通过给定的二手车交易样本数据”附件1：估价训练数据.txt”文件，选用合适的估价方法，构建相应的数据模型，来对二手车的零售交易价格进行预测，并且数据…

人工智能 2023年7月17日
0066
ReLU激活函数的快速介绍

ReLU全名 Rectified Linear Unit，意思是修正线性单元。Relu激活函数是常用的神经激活函数。ReLU函数其实是分段线性函数，把所有的负值都变为0，而正值…

人工智能 2023年6月13日
0086
LSTM实现时序问题预测(Tensorflow版本)

前言前面写了一个RNN对股票走势的预测，可以看到循环神经网络在时序问题上面的表现还是非常不错的，本次就用RNN的改进版本LSTM(长短时记忆神经网络)再做一个时间序列问题，看看L…

人工智能 2023年5月26日
0080
Opencv学习之：将图片的值进行范围调整 cv2.normalize()

cv2.normalize() 指定将图片的值放缩到 0-255 之间 array = cv2.normalize(array,None,0,255,cv2.NORM_MINMAX…

人工智能 2023年6月23日
00105
MMDetection3D：NuScenes转换为mmdet3d数据格式

; 一、创建流程 mmdet3d将nuscenes数据加载的流程进一步进行了标准化，以前的各类模型(e.g. CRFNet CenterFusion)等对于nuscenes数据集处…

人工智能 2023年7月12日
0080
利用Python进行数据分析：数据聚合与分组运算（基于DataFrame）

利用Python进行数据分析：数据聚合与分组运算在将数据集加载、融合、准备好之后，通常就是计算分组统计或生成透视表。pandas提供了一个灵活高效的groupby功能，对数据集进…

人工智能 2023年7月6日
0068
体验笔记本MX350显卡配置深度学习环境（CUDA+tensorflow）

初衷：想要体验一下笔记本的GPU于是开始搞起—— 显卡：GeForce MX350系统：WIN10 开始工作一、CUDA的安装 1.查看显卡支持的CUDA版本，找到 NVIDIA…

人工智能 2023年5月26日
00245
机器视觉模板匹配，halcon示例讲解，入门篇

机器视觉模板匹配，halcon示例讲解，入门篇基于灰度值模板基于形状（最常用的。受光照有一定影响）//使用ROI区域绘制模板。使用blob分析创建模板。使用CAD导入轮廓创建模板/…

人工智能 2023年6月20日
0069
【云驻共创】华为云IoT数据分析流程实操

文章目录一、数据分析的发展 * 1.数据分析概念 – 1.1 数据分析的背景 1.2 数据分析的目的 1.3数据分析的定义 2.物联网数据分析概念 3.华为云IoT数…

人工智能 2023年7月17日
0076
分类——ID3算法

2、锻炼分析问题、解决问题并动手实践的能力。实验环境: Anaconda 1、数据集准备代码实现如下：年龄：0代表青年，1代表中年，2代表老年；收入：0代表低，1代表…

人工智能 2023年7月3日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【语义分割】算法理论梳理：基础理论/常见网络FCN、DeepLab、LR-ASPP、UNet、U2Net

1. 常见数据集格式

2. 常见语义分割评价指标