基于不同监督强度分类的语义分割综述：A Breif Survey on Semantic Segmentation with Deep Learning

2023年7月1日上午3:24 • 人工智能 • 阅读 75

基于不同监督强度分类的语义分割综述：A Breif Survey on Semantic Segmentation with Deep Learning

引言：语义分割是计算机视觉中一项具有挑战性的任务。近年来，深度学习技术的应用大大提高了语义分割的性能。人们提出了大量的新方法。本文旨在对基于深度学习的语义分割方法的研究进展进行简要综述。全文将该领域的研究按其监督程度进行了分类，即完全监督方法、弱监督方法和半监督方法。文章还讨论了当前研究的共同挑战，并提出了该领域的几个有价值的发展研究点。本综述旨在让读者了解深度学习时代语义分割研究的进展和面临的挑战。

论文链接：https://www.sciencedirect.com/science/article/pii/S0925231220305476

; 基于不同监督强度分类的语义分割综述：A Breif Survey on Semantic Segmentation with Deep Learning

文章目录

基于不同监督强度分类的语义分割综述：A Breif Survey on Semantic Segmentation with Deep Learning
*
如何读论文？
语义分割介绍
常见的主干网络
🚀从不同监督强度介绍分割方法
–
当下的挑战、未来的方向
–
- 挑战
- 未来方向

如何读论文？

第一步，看标题+摘要+结论+图表（了解论文在干什么）

第二步，从头到尾读到最后（了解论文的各个部分）

第三步，精读，理解创新点、思路、动机

语义分割介绍

图(a)是原始输入图像

语义分割-图(b)：通过给定一张图片，语义分割能给每一个像素分配相应的标签/类别

图片分类-图©: 图片分类能告诉我们，什么物体存在于这张图片中

目标检测-图(d): 不仅仅需要知道图片中需要存在什么物体，还应该知道他们的坐标

实例分割-图(e): 与语义分割相似，区别是检测每一个物体作为一个独立的类别，相同的类别有不同的车，例如图片中的车，不同的车有着不同的颜色

全景分割-图(f): 类似于语义分割+实例分割的结合体，不仅要识别出每一个物体，也需要识别出背景

; 常见的主干网络

网络提出时间贡献AlexNet2012引发了深度学习的浪潮，首次将模型训练应用于GPU中VGG2014大量使用3×3或5×5的卷积核构建更深层的网络ResNet2016解决了梯度消失和梯度爆炸等问题，使得构建深层网络成为可能MobileNetV32019使用dw卷积，倒残差结构，加入自注意力机制，在精度损失较小的情况下，使模型更轻量化ViT2020首次将自然语言处理的方法应用到视觉任务中来，取得了较大的精度提升

🚀从不同监督强度介绍分割方法

全监督

1.基于语义的方法

context：翻译为上下文，我所理解的上下文，就是图像中的每一个像素点不可能是孤立的，一个像素一定和周围像素是有一定的关系的，大量像素的互相联系才产生了图像中的各种物体，所以上下文特征就指像素以及周边像素的某种联系。

在图像需要全局信息的问题中，都能很好的应用 膨胀卷积，膨胀卷积保持参数个数不变的情况下增大了卷积核的感受野，让每个卷积输出都包含较大范围的信息

使用膨胀卷积前后，分割效果对比：

; 2.特征增强法

在深层提取的特征具有更强的语义感知能力，但由于池化和步幅卷积，失去了空间细节。
来自浅层的特征更注重细节，如强边缘。在这种情况下，这两种类型的特征的适当合作有可能提高语义分割的性能。利用语义感知能力+空间细节能力提高性能

3.反卷积法

下图展示了转置卷积中不同s和p的情况

s=1, p=0, k=3s=2, p=0, k=3s=2, p=1, k=3

下列是一些基于反卷积的分割方法：

; 4.RNN法

利用局部或者全局的上下文依赖关系，使用RNN去检索上下文信息，以此作为分割的一部分依据

5.对抗生成网络(Gan)法

图形分割过程中，运用判别器对分割对象的局部属性、全局结构特点进行深入学习，以此获取不同像素间的有效空间关系，GAN用于扩展训练数据，提升训练效果。

首先对对抗网络进行预训练，
然后使用对抗性损失来微调分割网络，如下图所示。左边的分割网络将 RGB 图像作为输入，并产生每个像素的类别预测。
右边的对抗网络将标签图作为输入并生成类标签（1代表真实标注，0代表合成标签）

; 6.RGBD法

利用激光雷达、双目相机等工具，生成深度图象，用于辅助语义分割

引入深度信息后，其提供的额外结构信息能够有效辅助复杂和困难场景下的分割。比如，与室外场景相比，由于语义类别繁杂、遮挡严重、目标外观差异较大等原因，室内场景的分割任务要更难实现。此时，在结合深度信息的情况下，能够有效降低分割的难度。

7.实时法

限制输入尺寸
修改膨胀率
🔥修改卷积方式

; 弱监督

根据弱监督信号的形式，常见的弱监督语义分割可分为以下四类：

图像级标注：仅标注图像中相关物体所属的类别，是最简单的标注；
物体点标注：标注各个物体上某一点，以及相应类别；
物体框标注：标注各个物体所在的矩形框，以及相应类别；
物体划线标注：在各个物体上划一条线，以及相应类别

1.只提供分类标签

监督信息：这是一张包含xxx的图片？

优点：标注过程相对简单，不需要使用像素标注，样本获取相对容易，整体工作量相对较小

缺点：图像级标注的方法显得有些简单粗陋，很难取得良好的、符合预期的分割效果

标注结果如下：

基于图像级标注的弱监督语义分割大多采用多模块串联的形式进行

首先，利用图像级标注的图像类别标签，通过单标签或多标签分类的方式，训练出一个分类模型
然后，该分类模型通过计算图像中相应类别的类别特征响应图CAM来当作分割伪标签的种子区域
接着，使用优化算法（如 CRF、AffinityNet等）优化和扩张种子区域，获得最终的像素级的分割伪标签
最后，使用图像数据集和分割伪标签训练传统的分割算法（如 Deeplab 系列）

; 2.粗糙涂鸦分割标注

监督信息：包含涂鸦线条和涂鸦点的图像

基本原理：首先基于涂鸦点和涂鸦线条对图像进行标注处理，然后基于标注处理后的图片进行训练

标注结果如下：

半监督

1.域自适应法

目的：域适应的问题背景是两个同类的数据集，由于光照、角度等不同，存在域差异（分布不同），来自不同域的图片可能在外观上有很大的不同，但是他们的分割输出是结构化的，共享很多的相似性，比如空间布局和局部上下文。

增强模型的迁移能力！

; 2.小样本学习

可以理解为需要模型具有很强的迁移能力，只需要少量的样本就可以完成新类别的识别

目前在基于小样本学习的语义分割领域中，最广泛采用的技术路线图是构建新颖的结构，以巧妙地利用尽可能多的额外有用信息。

当下的挑战、未来的方向

挑战

精确度和速度的平衡
依赖高质量的训练数据
不同数据中模型难以迁移

未来方向

实时的语义分割
无监督分割
有遮挡物体的分割
实例/全景分割
完成新类别的识别

Original: https://blog.csdn.net/henghuizan2771/article/details/127432485
Author: 什么都只会一点
Title: 基于不同监督强度分类的语义分割综述：A Breif Survey on Semantic Segmentation with Deep Learning

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662587/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【NLP】文献翻译4——CH-SIMS：中文多模态情感分析数据集与细粒度的模态注释

CH-SIMS: A Chinese Multimodal Sentiment Analysis Dataset with Fine-grained Annotations of …

人工智能 2023年5月30日
0097
2022 年中国高校大数据挑战赛B题思路

题目互联网的快速发展，给图像、视频的传播方式带来巨大变化。图像作为媒体的重要载体，每天有大量的原创图像公开在互联网上，如何保护图像版权的同时不破坏原始的图像一直是图像处理方向的研…

人工智能 2023年6月22日
0091
华为机试真题 C++ 实现【叠积木】

有一堆长方体积木，它们的长度和宽度都相同，但长度不一。小橙想把这堆积木叠成一面墙，墙的每层可以放一个积木，也可以将两个积木拼接起来，要求每层的长度相同。若必须用完这些积木，叠成…

人工智能 2023年6月27日
0082
利用Latex在线工具Overleaf编写分区匹配（PM）、K-Means聚类、MeanShift聚类算法伪代码（附源码）

1. K-Means聚类算法事先确定K值，K就是类别数目在给定的数据样本点中随机选取K个点作为初始质心计算所有的点到初始质心的距离，离哪个质心近，就判为该质心的集合重新计算…

人工智能 2023年5月31日
00117
基于点云目标识别的PointRCNN在华为云modelArts的实现记录

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 PointRCNN在华为云modelArts的实现记录前言一、获得数据 * 1.下载数据二、环境配置 * 1…

人工智能 2023年7月12日
0065
DataFrame数据预处理：修改指定列的数据类型

【小白从小学Python、C、Java】【Python-计算机等级考试二级】【Python-数据分析】DataFrame数据预处理修改指定列的数据类型选择题对于以下python代…

人工智能 2023年7月6日
0094
使用Tesseract+OpenCV+Python进行光学字符识别 (OCR)

介绍我们人类几乎每时每刻都在阅读文本。如果我们的机器或系统也能像我们一样阅读文本，那不是很好吗？但更大的问题是”我们如何让我们的机器阅读”？这就是光学字符…

人工智能 2023年5月25日
0077
风控ML[13] | 特征稳定性指标PSI的原理与代码分享

PSI这个指标我们在风控建模前后都是需要密切关注的，这个指标直接反映了模型的稳定性，对于我们评估模型是否需要迭代有着直接的参考意义。今天我将从下面几方面来介绍一下这个指标。 Ind…

人工智能 2023年7月16日
0065
KNN-k近邻算法

KNN-k近邻算法 k近邻算法基础 * 解决分类问题在Notebook中实现 – 数据的准备 KNN过程通过函数封装来实现 scikit-learn 中的机器学习封…

人工智能 2023年7月2日
0051
联邦学习 | Non-IID数据论文：测量联邦视觉分类中不相同数据分布的影响

主要内容： 1、基于迪利克雷分布，提出了一种FL中Non-IID数据的生成方法； 2、对不同程度的Non-IID数据下，进行了较多的对比试验，研究客户端数据量、本地迭代轮数、学习率…

人工智能 2023年7月1日
0073
【宝藏级】全网最全的Seaborn详细教程-数据分析必备手册（2万字总结）

数据分析必备手册-Seaborn详细教程 seaborn库 * 安装：官方文档：关系绘图 * relplot – 1. 基本使用： 2. 添加hue参数： 3. 添…

人工智能 2023年7月14日
0072
蒙特卡罗（Monte Carlo) 模拟

蒙特卡罗模拟（方法），也称为计算机随机模拟方法、统计模拟法、统计试验法，是基于”随机数”的计算方法，或者是说把概率现象作为研究对象的数值模拟方法。其数学基…

人工智能 2023年7月4日
0095
Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等专栏详细介绍：NLP专栏简介：数据增强、智能标注…

人工智能 2023年6月1日
00146
python pytorch语音识别_PyTorch通过ASR实现语音到文本端的模型以及pytorch语音识别(speech) – pytorch中文网…

ASR，英文的全称是Automated Speech Recognition，即自动语音识别技术，它是一种将人的语音转换为文本的技术。今天我们主要了解pytorch实现语音到文本的…

人工智能 2023年5月27日
00128
卡尔曼滤波

接下来对温度的平均值进行化简，得到以下的公式：从这个公式中我们可以得到，要想知道现在时刻的估计值_就必须知道前一时刻的估计值和现在时刻的测量值，并且这是一种利用递归的形式来求…

人工智能 2023年6月17日
0081
浅谈CVPR2022的几个研究热点

CVPR2022刚刚结束，作为影响力最广的视觉盛会，今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴，已经磨拳擦掌，准备向CVPR2023投稿了。基于今年的工…

人工智能 2023年6月16日
0075

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31