FCN——语义分割的开山鼻祖（基于tf-Kersa复现代码）

2023年5月26日下午8:01 • 人工智能 • 阅读 102

1、什么是语义分割（semantic segmentation）？

图像语义分割，简而言之就是对一张图片上的所有像素点进行分类，将所有属于同一类的物体标记为同一像素点。

而今天要来介绍的则是第一个用卷积神经网络来做语义分割的方法——FCN。

; 2、FCN（Fully Convolutional Networks for Semantic Segmentation）

常见的卷积神经网络在多次卷积之后会接上若几个全连接层，将卷积和下采样产生的feature map映射成为一个固定长度的特征向量。一般的CNN结构适用于图像级别的分类和回归任务，因为它们最后都期望得到输入图像的分类的概率。常见的CNN网络如VGG、ResNet最后输出一个1000维的向量表示输入图像属于每一类的概率。

而FCN则将这些全连接层去掉，将其替换成常规的卷积层，然后上采样至原图的大小，输出预测结果。

对于开发者来说，最大的好处是改动小，从经典的分类网络改动至FCN，只需要替换全连接层就可以了。比如论文中的VGG16_FCN，只需要将最后的全连接层(4096, 1, 1), (4096, 1, 1)（1000, 1, 1）变为常规的卷积层(4096, 7, 7), (4096, 7, 7), (1000, 7, 7)，然后再进行上采样至原图大小，这样通道数就代表了输出分类的个数，每个通道上对应的0则是不属于该类的像素点，1则是属于该类的像素点。

精度损失

当然这样也会精度的损失，FCN经过backbone压缩了32倍（经过5个stage）之后，如果直接上采样，势必在物体的边缘会出现不连续、不正确的问题。所以FCN的作者也提出了不同stage的输出进行特征融合，用浅层网络的输出补充位置信息，用深层网络的输出补充语义信息，这样就在一定程度上弥补了边缘的上的损失。

如上图所示，stage5的输出经过32倍upsample直接输出则是FCN32的结构，这种结构精度是最低的。FCN16则是stage5的输出经过2倍upsample与stage的输出直接求和，然后再经过16倍的upsample作为最后的输出，这个结构的精度会比FCN32要高。FCN8的精度则要更高一点。结果会在后面放上。

; 上采样的方式

目前上采样的方式有两种，一种是反卷积，另一种是双线性插值。据原作者公布的源码上来看，作者是用了双线性插值，并且他们自己也说了，经过他们的测试，准确度没有显著的差异性，双线性插值没有参数要学习，速度会更快一些。

损失函数

FCN是逐像素点预测的，因此对于每个像素点来说，Ground Truth不是0就是1，即使分割图像是单通道的（依据分类数给出索引），那也可以变成One-Hot的形式，例如VOC的label就是21通道的。

所以根据像素点的预测方式，使用交叉熵就可以了。当然，后人改进采用了dice loss、focal loss等，在这里就不展开论述了。

预测精度

FCN的预测精度如图所示：

; 3、总结

FCN是采用深度学习进行语义分割的第一人，对比现在很多新网络效果确实差了点。但是后面的网络多数是沿用了FCN的思想，在此基础上加一些trick或加一些新的组件。如果能把FCN搞懂，后面再看其他分割网络就轻车熟路了。

4、实现代码

原作者公布的代码shelhamer/fcn.berkeleyvision.org
个人的代码复现Runist/FCN-keras
FCN的论文

Original: https://blog.csdn.net/weixin_42392454/article/details/118269765
Author: 热血厨师长
Title: FCN——语义分割的开山鼻祖（基于tf-Kersa复现代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521631/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Improving Distantly-Supervised Relation Extraction with Joint Label Embedding

Improving Distantly-Supervised Relation Extraction with Joint Label Embedding 领域：远程监督关系抽取…

人工智能 2023年5月28日
0084
室内移动机器人二维激光数据线特征提取算法的总结与开源算法分享

本文章总结并翻译于 A comparison of line extraction algorithms using 2D rangedata for indoor mobile …

人工智能 2023年6月2日
0093
【Unity】脚本：物体旋转的几种方法(记录)

如下： //第一种：旋转了…

人工智能 2023年6月4日
0097
《蜥蜴书》_讲义及源码解读_12

使用 TensorFlow 自定义模型和训练文章目录 * – + * 使用TensorFlow自定义模型和训练 * TensorFlow速览 * 像 NumPy 一样…

人工智能 2023年5月25日
0068
人工智能语音实训平台实验指导书

（一）语音采集类… 21.1语音采集实验… 21.2语音波形显示实验… 71.3语音编码实验… 131.4语音采样频率转换实验&#8…

人工智能 2023年6月10日
0084
Python数据分析初级

数据准备相关概念 3）.数据取值样本个数：就是数据表的行数，由于每一行数据也叫做一条记录，所以样本的个数也可以说是数据表的记录数。变量个数：调查对象的特征或属性称为变量，由于第…

人工智能 2023年6月11日
0069
YOLOv5的模型构建源码详解|CSDN创作打卡

深度学习入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。代码分析注释全家桶部分只是为了方便看循环，条件判断的那些缩进对应，…

人工智能 2023年7月10日
00148
python机器学习 train_test_split()函数用法解析及示例划分训练集和测试集以鸢尾数据为例入门级讲解

文章目录 train_test_split()用法获取数据划分训练集和测试集完整代码脚手架 train_test_split()用法 python机器学习中常用 train_…

人工智能 2023年7月5日
0060
Learning算法中的随机森林是指什么

问题背景随机森林是一种常用的集成学习算法，它可以用于分类和回归任务。它是由多个决策树构成的集合，并通过投票或平均方法进行预测。随机森林的目标是通过使用多个决策树减少单个决策树的过…

人工智能 2024年1月1日
0052
Pytorch模型测试时显存一直上升导致爆显存

首先说明: 由于我的测试集很大, 因此需要对测试集进行分批次推理. 在写代码的时候发现进行训练的时候大概显存只占用了2GB左右, 而且训练过程中显存占用量也基本上是不变的. 而在测…

人工智能 2023年7月13日
0077
PyTorch框架学习（一）—Tensor（张量）详解

PyTorch框架学习（一） — Tensor（张量）详解 1 Tensor 的概念 2 Tensor 与 Variable 3 创建Tensor的方法 * 3.1 直接创建Ten…

人工智能 2023年7月24日
0069
Python（8）序列

序列是Python中最基本的一种数据结构序列用于保存一组有序的数据，所有的数据在序列当中都有一个唯一的位置(索引) 并且序列中的数据会按照添加的顺序来分配索引序列的分类: 可…

人工智能 2023年6月30日
0073
二、python中Pandas数据框操作及数据提取

二、Pandas数据框操作及数据提取 import pandas as pd import numpy as np 数据框行列操作 1.1 创建DataFrame data = {…

人工智能 2023年7月7日
0059
实战教程：win10环境下用TensorRT推理YOLOv5

本文章记录在win10环境下用TensorRT推理YOLOv5. 例子来源于大佬的项目：https://github.com/wang-xinyu/tensorrtx，但此工程是在…

人工智能 2023年5月26日
0072
OpenCV进行图像分割：分水岭算法（相关函数介绍以及项目实现）

一、简介在图像处理的过程中，经常需要从图像中将前景对象作为目标图像分割或者提取出来。图像分割是图像处理过程中一种非常重要的操作。分水岭算法将图像形象地比喻为地理学上的地形表面，实…

人工智能 2023年6月17日
0094
什么是元宇宙？

如果你去网上搜索”元宇宙”这个词，这个概念源自上世纪90年代的科幻小说《雪崩》；元宇宙的英文是Metaverse，是由Meta，元，和Universe，…

人工智能 2023年6月2日
0099

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31