Out-of-distribution Detection系列专栏（六）

2023年7月14日上午5:27 • 人工智能 • 阅读 85

前言

A simple unified framework for detecting out-of-distribution samples and adversarial attacks

Motivation

Mahalanobis distance-based detector

Incremental Learning

Experiments

前言

本次要介绍的文章是deep Mahalanobis detector，顾名思义，这是一篇基于马氏距离来做OOD样本检测的文章。另外文章中还提出了如何检测对抗攻击样本，也就是我们之前用FGSM方法得到的那些样本。我们暂时只关注OOD检测，要了解对抗攻击的细节可以阅读文章中的相关章节。

A simple unified framework for detecting out-of-distribution samples and adversarial attacks

论文链接：https://arxiv.org/pdf/1807.03888.pdf

在这篇文章中，作者用马氏距离来作为”置信度”，并且给出了一种形式上的连续学习的方法。但是需要说明的一点是，改文章显式使用了OOD数据来训练检测器，因此，在你的文章中，此方法可能并不适合直接与其他技术进行比较，可以考虑将本文的指标作为一个OOD检测的upper bound。

Motivation

作者考虑到可能仅仅通过卷积神经网络最后的分类层输出信息不足以判断OOD和ID数据，因此，作者充分利用卷积神经网络的每一个特征层，并在此基础上，计算马氏距离，得到一个类似于生成式模型的检测器。要想这么做需要满足一个前提：那就是卷积神经网络的每层特征是符合多元高斯分布的，这样才可以计算马氏距离。当然，这是一个假设，并不容易验证。

Mahalanobis distance-based detector

对于一个按照有监督学习方式训练好的分类器，通过前向传播我们可以获得每一个卷积层上的特征，从而就可以计算出每个类别在每个卷积层的均值，以及所有样本在每个卷积层的协方差矩阵。

利用上面的表达式，我们就可以得到每个卷积层的协方差矩阵，以及每个类别在每个卷积层上的均值。协方差矩阵是一个方针，维度等于特征图的尺寸，也就是

。有了上述定义，对于一个新的样本

，我们可以通过选择最小的马氏距离来判断其类别：

上式中的

便可以用来作为置信度得分，可以直接与真实标签计算AUROC以及AUPR等指标。对应的，样本的类别就是使得置信度得分最高的下标

，即：

在上述的过程中，我们一直没有表明使用的是哪一层的特征。在原文中，作者为了增强算法的检测性能，使用了全部特征层马氏距离的加权结果来作为置信度，并在，在该过程中，还使用了ODIN中提出的Input Preprocessing方法来进一步拉开ID数据与OOD数据之间的差异，算法的详细流程如下：

算法的流程比较清晰，对于每一个卷积层

，先判断样本的类别，然后利用Input Preprocessing方法进一步提升马氏距离得分(即马氏距离的相反数)，然后利用处理后的样本计算置信度得分。最后输出的得分是每一层马氏距离得分的加权值。

这里需要说明一下，就是计算AUROC以及AUPR时，只需要给出预测的置信度得分即可，这里的置信度并不限制数值范围，只要与标签一致即可：也就是说，如果标签中1代表ID数据，0代表OOD数据，那么你的置信度得分应该是越大越代表是ID数据，越小越代表OOD数据。这是因为AUROC和AUPR是基于排序来逐个选择阈值的。在本文中，作者使用的是马氏距离的相反数来表示样本来自于ID的置信度。

另外，在文章中，权重系数

是这样得到的：在每一层的特征上训练一个二分类器（逻辑回归），将二分类器对ID数据和OOD数据的分类准确率作为本层马氏距离得分的组合系数。从文章的代码来看，作者是直接使用了OOD数据参加训练来得到该系数，因此，相当于利用了额外的信息，分类性能好的层权重就会很高，而分类性能差的层，权重就较低。但是，在实际中，我们无法预料OOD数据的分布，也就无法判断哪一层更重要，因此该方法存在一些值得商榷的地方。

Incremental Learning

除了检测OOD数据之外，作者还提供了一种适用于连续学习或者是增长学习的方法。对于一个新的类别，直接在每一层的特征上计算新类别的均值，然后使用滑动平均的思想，将协方差矩阵更新为原来的协方差矩阵与新类别协方差矩阵的加权和，加权系数为类别数量的占比。详细的算法流程如下，是很容易理解的：

这种连续学习的方法，如果新的类别数据本身就能够被原来的卷积神经网络在特征空间聚集在一起，那么它的性能是不错的，但是往往卷积神经网络对于新类别数据并不能很好的处理，常常倾向于将新类别数据与原始数据混淆，从而使得方法失效。

Experiments

作者给出了在OOD检测、连续学习以及对抗样本攻击等实验上的结果，这里我们只关注一下OOD检测的效果：

从上表可以看出，deep Mahalanobis detector的性能是超过了Max-Softmax以及ODIN的，但是有一点我们要注意，就是这个方法使用了OOD数据，所以表格中的结果会远远高于未使用OOD数据的Max-Softmax方法以及之前介绍过的ODIN方法。不过，我们还是可以从这个方法中得到一些启发： 检测OOD数据要充分利用分类网络各层的特征，从而增强检测的鲁棒性。

最后展示一下作者尝试过的不同距离度量的性能差异：

可以看出，马氏距离要好于直接使用Softmax或者是欧氏距离等方法，更多的实验细节可参考原始论文。

Original: https://blog.csdn.net/qq_36478718/article/details/122468204
Author: DS..
Title: Out-of-distribution Detection系列专栏（六）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691395/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【华为OD机试真题23 JAVA】单词倒序

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月30日
0050
【Matlab】数据插值

数据插值插值与拟合的区别：实现方法：插值要求曲线穿过样本点，而拟合不需要穿过样本点，只要求总体误差最小。结果形式：插值是分段逼近样本点，没有同一的逼近函数；函数拟合则用一个函…

人工智能 2023年6月15日
0081
（Attention机制原文）论文阅读：Neural Machine Translation by Jointly Learning to Align and Translate

与传统的机器翻译相比，基于神经网络的机器翻译方法能够通过统一调参最大化。Encoder-decoder被广泛用于机器翻译，它将一句话的语义信息表示为一个固定长度的向量。然而，这种固…

人工智能 2023年5月28日
0062
【动手学深度学习】3 Softmax 回归 + 损失函数

上一篇移步【动手学深度学习PyTorch版】2 线性回归_水w的博客-CSDN博客目录一、线性回归的简洁实现 1.1. 生成数据集 1.2. 读取数据集 1.3. 定义模型 1…

人工智能 2023年6月18日
0087
R语言ggplot2可视化：自定义设置X轴上的时间间隔（中断、以年为单位），使用scale_x_date()自定义设置坐标轴间隔和标签、添加标题、副标题、题注信息

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0082
day 1

想法很简单，但实现起来可能就不是那么回事了。数组的元素是不能删的，只能覆盖方法：双指针法注意题目：输入数组是以「引用」方式传递的方法：双指针why可以用双指针：看似无序，实则有…

人工智能 2023年6月4日
0076
QT的QSoundEffect类的使用

详细说明QSoundEffect类提供了一种播放低延迟声音效果的方法。此类允许您以通常较低的延迟方式播放未压缩的音频文件（通常为WAV文件），并且适合响应用户操作（例如虚拟键盘声音…

人工智能 2023年5月27日
0092
R语言多因素有交互方差分析（Two-Way ANOVA）：检测和理解两个因素之间的交互作用的最简单的方法是使用交互作用图、双因素交互作用图可视化（interaction plot）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月18日
0064
保姆级讲解生成对抗网络GAN，及原始GAN的torch复现

保姆级讲解生成对抗网络GAN：保姆级讲解生成对抗网络 GAN 公众号目录综述： https://wangguisen.blog.csdn.net/article/details…

人工智能 2023年6月28日
0074
基于OpenCV训练口罩检测数据集并测试

以下内容是利用opencv自带的训练器opencv_traincascade.exe与opencv_createsamples.exe，来对口罩数据集进行训练。内容是自己操作过程中…

人工智能 2023年7月18日
0043
xhs-web校验流程分析

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月26日
0077
运算放大器的原理/MOSFET工作原理/三极管工作原理/光耦工作原理

光耦具备光电隔离的作用，在很多产品应用中都使用到了光耦，下面简要介绍个人对TLP281光耦的一些应用电路。 TLP281主要技术参数如下表所示。 1.GPIO电平与输出电平正向设计…

人工智能 2023年6月10日
0084
A Neighborhood-Attention Fine-grained Entity Typing for Knowledge Graph Completion：AttEt

论文地址 1 目的该论文主要用于知识图谱补全的一个子任务，实体类型推测。提出一个方法为AttEt，AttEt通过聚集具有类型特定权重的给定实体的邻域知识，在实现时采用entity…

人工智能 2023年6月1日
0079
tensorflow-gpu版本安装教程（过程详细）

准备工作：在开始安装前，如果你的电脑装过tensorflow，请先把他们卸载干净，包括依赖的包（tensorflow-estimator、tensorboard、tensorflo…

人工智能 2023年6月16日
00156
python导入、导出csv文件的方法

python 导入csv文件的方法 pd.read_csv（）几个常用参数： filepath_or_buffer :文件路径 header:指定哪一行为列名 index_col:…

人工智能 2023年6月15日
0087
传感器的动态和静态特性

传感器的特性是指传感器的输入量和输出量之间的对应关系。通常把传感器的特性分为两种：静态特性和动态特性。静态特性是指输入不随时间而变化的特性，它表示传感器在被测量各个值处于稳定状…

人工智能 2023年6月2日
00170

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Out-of-distribution Detection系列专栏（六）

前言

A simple unified framework for detecting out-of-distribution samples and adversarial attacks

Motivation

Mahalanobis distance-based detector

Incremental Learning

Experiments

大家都在看