【论文笔记1】小样本分类

FSL学习笔记

最新论文&代码收集网站:网址连接

论文1: 孪生网络 (Metric Based)

Siamese Neural Networks for One-shot Image Recognition

通过Siamese神经网络借助监督度量的方法学习图像表示,然后重用该网络的特征进行OneshowtLearning,而不需要任何再训练。

孪生网络由两个结构相同(参数也相同:权重绑定了)的网络组成,这两个网络接受不同的输入,并且这两个网络最后由一个能量函数(Energy fuction)汇合到一起。这个Energy Fuction用于计算两个特征图之间的距离。
使用加权的L1距离来进行特征向量之间的距离,并结合了sigmoid激活函数。(使用了交叉熵损失函数)
孪生网络的模型结构如图所示。 最后的卷积层中的单位被压平成一个矢量。

【论文笔记1】小样本分类
预测向量(prediction vector)的公式是:p =
【论文笔记1】小样本分类
其中,σ是sigmoi的函数,αj是对每个向量的第j维的权重进行调节(是可学习的参数)。
所定义的交叉熵损失函数如下所示:
【论文笔记1】小样本分类
当两张图片相同时y=1;当两张图片不同时y=0。

; 论文2 匹配网络 (Metric Based)

Matching Networks for One Shot Learning

比较高明的解读:链接
研究背景

  1. 少样本数据经常存在,但是
  2. 数据增强和正则化方法能够避免过拟合,却不能让网络学习的很好
  3. 需要随机梯度下降多次,这是浪费时间的

研究贡献

  • 提出了一种匹配网络 MN
  • test and train conditions must match. (为了使得网络能够更快的适应新的模型算法,即 训练的时候就和测试一样都是一样的输入方式)
  • 关键:经过训练后,匹配网络能够为未观察到的类产生合理的测试标签,而不需要对网络进行任何更改

Original: https://blog.csdn.net/vibration_xu/article/details/125956287
Author: XingshiXu
Title: 【论文笔记1】小样本分类

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/665456/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球