对比学习用于图像语义分割（两篇文章）

2023年6月17日上午4:10 • 人工智能 • 阅读 110

一、Exploring Cross-Image Pixel Contrast for Semantic Segmentation

原文链接：Exploring Cross-Image Pixel Contrast for Semantic Segmentation | IEEE Conference Publication | IEEE Xplore

本文方法是有监督对比学习（即正样本为类别相同的像素，负样本为类别不同的像素）。两个值得关注的地方：

（a）跨图像之间找正负样本、计算损失是有帮助的

（b）大量的负样本在无监督对比学习中很关键

网络结构和损失定义

通过编码器得到表达（embedding），通过分类头分类并计算交叉熵损失；同时，通过projection head（2层

conv，中间加ReLU）得到每个像素

归一化的特征向量，计算对比损失：

最终损失定义为分类的交叉熵损失和对比学习的对比损失之和。

存储策略

为了存储正负样本，每个minibatch在每个类别下取

个像素，将其放入一个容量为对比学习用于图像语义分割（两篇文章）

的队列中，整个队列的样本将用于下一轮迭代。同时保存每张图像每个类别所有像素表达的平均作为区域表达，同时进行pixel-to-pixel和pixel-to-region的对比学习。

将队列中的像素表达和区域表达统记为

。

困难样本处理

（a）对于对比学习任务：困难样本定义为相似度高的负样本和相似度低的正样本。

采用Semi-Hard Example Sampling策略，对每个像素

，在

中选取其正负样本中前10%的困难样本，再随机抽取

个（不直接取

个最困难样本是防止过拟合）。

（b）对于分类任务：困难样本定义为分类错误的样本。

采用Segmentation-Aware Hard Anchor Sampling策略，每个minibatch中一半像素随机选取，另一半选取分类错误的像素。

推断阶段

在推断阶段，不需要

和困难样本选取，所以推断时和不带对比损失的网络一样。

二、Contrastive Learning for Label-Efficient Semantic Segmentation

原文链接：Contrastive Learning for Label Efficient Semantic Segmentation | IEEE Conference Publication | IEEE Xplore

本文也提到大量的负样本在非监督对比学习中很关键。但这篇文章实验证明跨图像之间找正负样本并没有性能提升，猜想原因可能是在跨图像找正负样本时未用到每张图像的所有像素。

方案

本文方案非常简单：先使用带标签数据定义正负样本，用对比损失（下面的公式）预训练模型，此时有一个projection head（3层

卷积+unit normalization+ReLU）。head的输出为下面公式中的

；输入为像素的表达。

大概就是对一个图像及其增广计算相似度矩阵，对每一行做softmax后，将正样本之间的值求平均。

再在语义分割任务下用交叉熵损失来微调。此时丢掉projection head，加一个分类头，同样使用带标签数据微调整个网络。

两种设置

（1）全监督设置——和上面所介绍的一致（使用标签定义正负样本）。

（2）半监督设置——先用全监督设置训练一个网络，再在不带标签的数据上运行，得到语义分割结果，给分类概率大于阈值

的像素加上伪标签后，按照伪标签定义正负样本后重新按照类似全监督设置的方案训练网络。

Original: https://blog.csdn.net/weixin_45657478/article/details/125811034
Author: byzy
Title: 对比学习用于图像语义分割（两篇文章）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628426/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

CMake来编译OpenCV，细致教程

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、openCV配置cmake编译二、使用步骤 * 1.下载openCV [openCV官网](…

人工智能 2023年7月19日
0096
群体知识图谱：分布式知识迁移与联邦式图谱推理

摘要群体知识图谱是指通过群体协作，以去中心化或分布式方式管理和维护的知识图谱。相比现有的集中式管理的知识图谱，群体知识图谱具备知识确权、隐私保护、众包激励、可信溯责等特点。尝试探…

人工智能 2023年6月1日
00100
Ubuntu18.04 + OpenCv 2.4.13安装（亲测有效，内含踩坑解决方案）

Ubuntu18.04 + OpenCv 2.4.13安装（亲测有效，内含踩坑解决方案）安装cmake-qt-gui 下载apt包下载OpenCV并修改一些文件第一坑：改文件…

人工智能 2023年7月20日
0077
02 pandas入门

目录 1. pandas数据结构介绍 1.1 Series 1.2 DataFrame 1.3 索引对象 2. 基本功能 2.1 重建索引 2.2 轴向上删除条目 2.3 索引、选…

人工智能 2023年7月8日
0075
ESP32实现红外遥控发射与接收

文章目录 * – 一，原理 – + 1.1 概括 + 1.2，时钟 + 1.3，认识 item + 1.4，发射/接收器 + 1.5 电路原理图 + * 1…

人工智能 2023年5月27日
00154
关于yolov5的一些说明（txt文件、训练结果分析等）

一、yolo中txt文件的说明：二、yolo跑视频、图片文件的格式：三、yolov5训练结果不好的原因： 1. 欠拟合：在训练集上表现很差，测试集上表现也很差的现象可能是欠拟…

人工智能 2023年6月12日
0095
SOFTMAX回归

一、softmax回归与线性回归适用于输出为连续值的情景不同，它适用于像图像类别这样的离散值，主要解决分类问题，且softmax回归的输出单元从一个变成了多个。然而直接使用输出…

人工智能 2023年6月17日
0074
使用OpenCV训练分类器时出现Error: Bad argument 和 Error: Insufficient memory 解决办法

OpenCV(3.4.1) Error: Bad argument (Can not get new positive sample. The most possible reas…

人工智能 2023年7月20日
0075
已解决ModuleNotFoundError: No module named ‘paddle‘

已解决（paddleocr导包报错）ModuleNotFoundError: No module named ‘paddle’ 文章目录报错代码报错翻译…

人工智能 2023年7月5日
0087
VAD检测原理及其过程

顾名思义，VAD（Voice Activity …

人工智能 2023年5月27日
0091
【读论文】一种通用句子编码：Universal Sentence Encoder

USE 目标模型结构训练通用句子编码器是google在2018年提出的将句子编码成嵌入向量的模型，这些嵌入向量专门针对将学习转移到其他NLP任务。文章中指出，对于许多NLP任…

人工智能 2023年5月27日
0089
模型压缩技术：综述【模型蒸馏/Distillation；量化/Quantization；剪枝/Pruning；参数共享】

BERT 在很多 NLP 任务上都取得不错的效果，但是其模型体积与计算量都很大，而且现在出现了更多越来越大的模型，例如 roBERTa 和 GPT2。由于这些模型的太大，难以用于一…

人工智能 2023年5月28日
0099
手把手教你用pytorch实现k折交叉验证，解决类别不平衡

在用深度学习做分类的时候，常常需要进行交叉验证，目前pytorch没有通用的一套代码来实现这个功能。可以借助 sklearn中的 StratifiedKFold，KFold来实现，…

人工智能 2023年7月20日
0085
pandas

pandas 一、介绍pandas 1、优点 2、pandas的数据结构（1） DataFrame DataFrame是一个类似于二维数组或表格(如excel)的对象，既有行索引…

人工智能 2023年7月8日
0068
基

安装教程 1.Anaconda安装从anaconda官网下载python3.8版本安装时勾选将anaconda加入到环境变量中打开anaconda prompt 输入以下命令…

人工智能 2023年5月26日
00130
升级Linux服务器你必须要知道的事

服务器安全是每个系统管理员的头等大事。除了拥有第三方安全工具（如防火墙，DDoS保护等）外，使生产服务器上的所有代码保持最新也是极为重要的。当您的应用程序投入生产时，升级它的风险…

人工智能 2023年7月30日
0099

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

对比学习用于图像语义分割（两篇文章）

大家都在看