【论文阅读】Attention-based Deep Multiple Instance Learning

2023年7月13日下午7:50 • 人工智能 • 阅读 67

题目：CCF A-Loss-Based Attention for Deep Multiple Instance Learning

International conference on machine learning

摘要

多实例学习 (MIL) 是监督学习的一种变体，其中将单个类标签分配给一袋实例。
在本文中，我们将 MIL 问题描述为学习 包标签的伯努利分布，其中包标签概率由 神经网络完全参数化。此外，我们提出了一种基于神经网络的 置换不变聚合算子，它对应于注意机制。值得注意的是，所提出的基于注意力的算子的应用可以深入了解每个实例对包标签的贡献。
我们凭经验表明，我们的方法在基准 MIL 数据集上实现了与最佳 MIL 方法相当的性能，并且它在基于 MNIST 的 MIL 数据集和两个真实组织病理学数据集上优于其他方法，而不会牺牲可解释性。

引入

多示例学习：
假设图像清楚地代表了一个类别（一个类）。然而，在许多实际应用中，会观察到多个实例，例如，计算病理学、乳房 X 线摄影或 CT 肺筛查）中尤为明显，其中图像通常由单个标签（良性/恶性）或区域描述粗略地给出了兴趣
MIL 处理分配了单个类标签的实例包。因此，MIL 的主要目标是学习一个预测袋子标签的模型
利用包之间的相似性 (Cheplygina et al., 2015b)，将实例嵌入到紧凑的低维表示中，然后进一步馈送到包级分类器、实例级分类器的响应

背景：
目前的一些方法：利用包之间的相似性 (Cheplygina et al., 2015b)，将实例嵌入到紧凑的低维表示中，然后进一步馈送到包级分类器；并结合实例级分类器的响应。只有最后一种方法能够提供可解释的结果。但此类方法的实例级准确度较低。

本文：
提出了一种新方法，旨在将 可解释性融入 MIL 方法并增加其灵活性。
我们使用包标签的伯努利分布来制定 MIL 模型，并通过优化 对数似然函数来训练它。
对称函数的基本定理为包标签概率建模提供了一个过程：（1）将实例转化为低维嵌入；（2）一个置换不变（对称）的聚合函数；（3）对包概率的转换
本文建议使用 神经网络（ 即卷积层和全连接层的组合） 参数化所有转换，并允许通过优化无约束的目标函数以端到端的方式训练模型。
本文建议用可训练的加权平均值替换广泛使用的 置换不变算子，例如最大算子最大值和平均算子平均值，其中权重由 两层神经网络给出。两层神经网络对应于 注意力机制。值得注意的是，注意力权重使我们能够找到关键实例，这些实例可以进一步用于突出可能的 ROI。

符号系统

符号含义
X = { x 1 , … , x K } \boldsymbol{X}={\boldsymbol{x}_1,\dots,\boldsymbol{x}_K}X ={x 1 ,…,x K }x k \boldsymbol{x_k}x k

实例
K K K

不同包的实例数量不同
Y \boldsymbol{Y}Y

标签向量
{ y i , … , y K } , y k ∈ { 0 , 1 } {y_i,\dots,y_K},y_k \in {0,1}{y i ,…,y K },y k ∈{0 ,1 }

每个实例的标签
h k \boldsymbol{h}_k h k

实例的嵌入

方法

2.1. Multiple instance learning (MIL)

通过优化对数似然函数来训练 MIL 模型，其中袋标签根据伯努利分布分布，即给定实例包 X，Y = 1 的概率

【论文阅读】Attention-based Deep Multiple Instance Learning

Theorem 1 包X \bold{X}X的评分函数，其中 f 和 g 是合适的变换。给出的分解对袋子概率建模的一般策略。

Theorem 2 用 max 而不是 sum 的类似分解

共同点：一种通用的三步方法来对包进行分类：（1）用函数 f 对实例进行转换（2）使用对称（排列不变）函数σ对转换后的实例进行组合（3）由f使用函数g变换的组合实例的变换

于给定的 MIL 运算符，有两种主要的 MIL 方法：（1）实例级方法（2）嵌入级方法
我们将展示如何通过使用新的 MIL 池来修改嵌入级方法以使其可解释。

; 2.2. MIL with Neural Networks

由 神经网络 fψ(·) 参数化的变换；h k ∈ H h_k \in \mathcal{H}h k ∈H;若h k ∈ 0 , 1 h_k \in {0,1}h k ∈0 ,1,则为基于实例的方法；若h k ∈ R M h_k \in \mathbb{R}^M h k ∈R M,则为嵌入的方法

转换g ϕ g_\phi g ϕ:在基于实例的方法中，变换 gφ 只是恒等式，而在基于嵌入的方法中，它也可以由具有参数 φ 的神经网络参数化

2.3. MIL pooling

两个MIL池化算子保证得分函数为对称函数：
（1）最大算子

(2)平均算子

（3）其他算子代替定理2中的max
例如凸最大算子（即 log-sum-exp）、集成分割和识别、噪声或和噪声和

; 2.4. Attention-based MIL pooling

所有 MIL 池化算子都有一个明显的缺点，即它们是预定义的且不可训练的。因此，灵活和自适应的 MIL 池可以通过调整任务和数据来获得更好的结果。
使用实例的加权平均值（低维嵌入），其中权重由神经网络确定。其中权重与嵌入一起是 f 函数的一部分

我们注意到 tanh(·) 非线性对于学习复杂关系可能效率低下，因此，我们建议额外使用门控机制以及 tanh(·) 非线性：

Original: https://blog.csdn.net/qq_43505356/article/details/123471298
Author: Windingd
Title: 【论文阅读】Attention-based Deep Multiple Instance Learning

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690503/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用棋盘格进行相机标定

利用棋盘格进行相机标定前言一、为什么要进行相机标定？简单来说，相机标定的目的主要就是通过构建方程来求解相机内参数，相机的内参数包括Fx,Fy,Cx,Cy以及畸变参数。通过求解…

人工智能 2023年7月20日
0034
深度理解感受野（一）什么是感受野？

Introduction 经典目标检测和最新目标跟踪都用到了RPN(region proposal network)，锚框(anchor)是RPN的基础，感受野(receptive…

人工智能 2023年7月22日
0066
PyCharm如何配置Qt5开发环境

安装PyQt5 pip install PyQt5 -i https://pypi.douban.com/simple 安装PyQt5-tools pip install PyQt…

人工智能 2023年5月30日
0079
python计算两组数据的协方差_(python3)数据分析之Pandas：汇总、统计、相关系数和协方差…

pandas对象中拥有一组常用的数学和统计方法，跟NumPy数组相比，它们是基于没有缺失数据的加上构建的。 In [71]: df = DataFrame([[1.4,np.nan…

人工智能 2023年7月9日
0087
ptorch常用代码梯度篇（梯度裁剪、梯度累积、冻结预训练层等）

在训练比较深或者循环神经网络模型的过程中，我们有可能发生梯度爆炸的情况，这样会导致我们模型训练无法收敛。我们可以采取一个简单的策略来避免梯度的爆炸，那就是梯度截断 Clip, …

人工智能 2023年6月4日
00104
[Python人工智能] 三十八.Keras构建无监督学习Autoencoder模型及MNIST聚类可视化详解

从本专栏开始，作者正式研究Python深度学习、神经网络及人工智能相关知识。前一篇文章详细讲解了基于Transformer的商品评论情感分析案例。本篇文章将分享无监督学习Autoe…

人工智能 2023年5月31日
0089
问答系统评估指标之ROUGE-L和BLUE-N

如何评测问答系统给出的一个答案的好坏 ? 常用的有 ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和 BLEU…

人工智能 2023年5月31日
0096
Python 基于OpenCV+face_recognition实现人脸捕捉与人脸识别（照片对比）

1.安装包依赖与上篇通过摄像头动态识别人脸一样，先下载好opencv-python、face-recognition，这里因为使用的是照片对比的方式，特意使用tkinter画了一…

人工智能 2023年5月28日
0056
K210学习笔记——MaixHub在线训练模型(新版)

文章目录前言一、新版MaixHub功能介绍二、模型训练使用方法 * 项目创建图片采集模型训练模型部署总结前言最近sipeed推出了新版的maixhub在线训练平台…

人工智能 2023年6月25日
0078
融合中文字形和拼音的预训练模型：ChineseBERT（ACL2021）

不同于英文字母，中文的字形和拼音都有其独特的含义，例如’液’、’河’和’湖’都有相同的偏旁，其含义也有联系…

人工智能 2023年5月28日
0076
stata画图命令_Stata学习绘图笔记(1)

最近在学习 Stata 的相关知识，正好工作写报告也需要用 Excel, 在用 Excel 进行画图的同时，自己也用 Stata 把图画一遍，增加熟练度。自己做一个笔记，然后再继续…

人工智能 2023年6月18日
0095
【Python】利用Python拟合函数曲线

使用Python拟合函数曲线需要用到一些第三方库： numpy：科学计算的基础库（例如：矩阵） matplotlib：绘图库 scipy：科学计算库如果没有安装过这些库，需要在命…

人工智能 2023年7月5日
0075
Transformers 源码阅读之BertTokenizerFast分词模型

数据集准备从bert-base-chinese下载预训练语言模型及其他词表，由于使用的是pytorch，因此下载 pytorch_model.bin即可。如果要使用英文模型，就…

人工智能 2023年7月27日
0065
Google Earth Engine（GEE）批量下载夜光遥感数据

今天来简单分享下如何在GEE中批量下载夜光遥感数据数据介绍：夜光遥感数据主要分为两种，一种是 DMSP/OLS ，由美国军事气象卫星(DMSP)搭载的线性扫描业务系统(OLS…

人工智能 2023年7月28日
0071
jupyter的一些基础操作

进入方式这里使用anaconda自带的 Jupyter Netbook，虚拟环境默认是anaconda下的python3虚拟环境。 cmd输入命令 jupyter noteboo…

人工智能 2023年5月26日
0069
解决pandas：ValueError: Cannot convert non-finite values (NA or inf) to integer

解决pandas：ValueError: Cannot convert non-finite values (NA or inf) to integer 目录解决pandas：V…

人工智能 2023年6月19日
00121

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30