双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

一、论文研究背景

语义分割(Semantic segmentatio)是计算机视觉中的关键任务之 一。现实中,越来越多的应用场景需要从影像中推理出相关的知识或语义(即由具体到抽象 的过程)。作为计算机视觉的核心问题,语义分割对于场景理解的重要性日渐突出。

1.1相关概念辨析

①语义分割 ②实例分割 ③全景分割

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

语义即图像想要表达的意思,语义分割可以简单理解为抠图+分类。如下图b图所示,行人标为红色、汽车标为蓝色。实例分割是在语义分割的基础之上,对图像上除背景以外的对象进行分类。与语义分割不同的是,每一个对象都是单独的,不再按照大类划分。即每一个人都对应一个颜色,每一辆车也对应一个颜色。实例分割=语义分割+实例分割,理解为两者的结合,如下图的d图所示。

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

1.2 图像分割的历史

所有的发展都是漫长的技术积累,加上一些外界条件满足时就会产生质变。我们简单总结了图像分割的几个时期:

  1. 2000年之前,数字图像处理时我们采用方法基于几类:阈值分割、区域分割、边缘分割、纹理特征、聚类等。
  2. 2000年到2010年期间, 主要方法有四类:基于图论、聚类、分类以及聚类和分类结合。
  3. 2010年至今,神经网络模型的崛起和深度学习的发展。

1.3 传统方法的问题

在FCN问世之前,也有一些传统的方法进行语义分割,比如:Normalized cut 、Structured Random Forests 、SVM等等。阐述一下传统方法的缺点:在实际运用中,每运行一次N-cut,只能切割一次图片,为了分割出图像上的多个物体,需要多次运行,下图示例了对原图 a 进行 7 次 N-cut 后,每次分割出 的结果。 缺点:效率低、准确度不高。

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

1.4 利用深度学习的缺点

①不匹配关系 ②不寻常类

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

如上图所示,枕头、床单、以及床尾柜子都容易被当作和床是一体的。

二、语义分割实现流程

2.1训练

根据batch_size大小,将 数据集中的训练样本和标签读入卷积神经网络。根据实际需要,应先对训练图片及标签进行预处理,如裁剪、数据增强 等。这有利于深层网络的的训练,加速收敛过程,同时也避免过拟合问题并增强了模型的泛化能力。

2.2验证

训练一个epoch结束后, 将数据集中的验证样本和标签 读入卷积神经网络,并载入训 练权重。根据编写好的语义分 割指标进行验证,得到当前训 练过程中的指标分数,保存对 应权重。常用一次训练一次验 证的方法更好的监督模型表现。

2.3测试

所有训练结束后,将数据集中的测试样本和标签读入卷 积神经网络,并将保存的最好权重值载入模型,进行测试。 测试结果分为两种,一种是根据常用指标分数衡量网络性能,另一种是将网络的预测结果以 图片的形式保存下来,直观感受分割的精确程度。

三、语义分割常用数据集

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

现提供CamVid数据集:CamVid数据集,语义分割FCN训练数据集

【因下篇文章内容为利用该数据集进行实现FCN,所以多对此数据集进行介绍】

CamVid全称:The Cambridge-driving Labeled Video Database,该数据集由剑桥大学工程系于 2008 年发布,是第一个具有目标类别语义标签的视频集合。数据库提供32个ground truth语义标签,将每个像素与语义类别之一相关联。

数据集包 括 700 多张精准标注的图片用于强监督学习,可分为训练集、验证集、测试集。 同时, 在 CamVid 数据集中通常使用 11 种常用的类别来进行分割精度的评估,分别为:道路 (Road)、交通标志(Symbol)、汽车(Car)、天空(Sky)、行人道(Sidewalk)、电线杆 (Pole)、围墙(Fence)、行人(Pedestrian)、建筑物(Building)、自行车(Bicyclist)、 树木(Tree)。

四、语义分割常用指标

4.1 Pixel Accuracy(PA 像素精度)

定义:标记正确的像素占总像素的比例

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

4.2 Mean Pixel Accuracy(MPA 均像素精度)

定义:计算每个类内被正确分类像素数的比例,再求所有类的平均。

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

4.3Mean Intersection over Union(MIoU 均交并比)

定义:计算真实值和预测值的交集和并集

双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

Ps:数学不好的同学们,一笑而过就行,不过要记住这三个常用指标的名称,在后续的程序实现中,利用混淆矩阵的方式来计算各个指标的值。非常巧妙!有空为大家更新。

更新啦!!! 解读混淆矩阵在语义分割FCN指标计算中的应用(含代码实现)

语义分割的开山作FCN在另一篇文章中,为大家做详细介绍。

参考:FCN : 利用全卷积神经网络进行图像语义分割

Original: https://blog.csdn.net/m0_62128864/article/details/124304881
Author: 码农男孩
Title: 双重角度看语义分割:传统语义分割方法 对比 深度学习语义分割方法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/661888/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球