(四)孪生神经网络介绍及pytorch实现

2023年6月23日上午3:10 • 人工智能 • 阅读 97

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

孪生神经网络介绍及pytorch实现

*
– 1.孪生神经网络
– 2.孪生神经网络的损失函数
– 2.1 Triplet Loss
– 2.2 Contrastive Loss
– 3.动手实现一个孪生网络
–
+ 3.1 网络结构
+ 3.2 损失函数
+ 3.3 数据
+ 3.4 训练结果
– 4.SiameseNetWork的一些应用
– 参考资料

1.孪生神经网络

在深度学习领域，神经网络取得了成功。但普通的神经网络模型的训练需要大量的数据，对于一些数据有限的场景，如人脸验证，签字验证，必须考虑其他方法。

Siamese 古语表示 瞿罗，即现在的泰国，如 Siamese cat，之所以 Siamese表示孪生，是因为19世纪 瞿罗出了一对连体双胞胎，在 美国玲玲马戏团做演出比较出名，因此提起 Siamese即表示孪生的意思。1

孪生神经网络 Siamese Network,如其名字 孪生Siamese的意思即存在连体，连体即彼此共享一部分。孪生神经网络的结构也包括两个子网络，两个子网络之间共享权重。

图片来自于1

如上图，两个网络是同一个并共享权重，当两个子网络不共享权重时，通常定义为 伪孪生神经网络。

图片来自于1

从上面的图中可以看出来，孪生神经网络有两个输入， input1和 input2，因此孪生神经网络常用来通过比较两个输入特征向量的距离来衡量两个输入的相似度。早在 1993年的 NIPS上 Yann Lecun就发表了使用孪生神经网络做签名验证的论文。现在的人脸识别应用也有基于孪生神经来做的。

孪生神经网络的优点，对于类别不平衡问题更鲁棒，更易于做集成学习(Ensemble Learning),可以从语义相似性上学习来估测两个输入的距离。 孪生神经网络的缺点，由于有两个输入，两个子网，其训练相对于常规网络运算量更大，需要的时间更长。输出的结果不是概率，孪生神经网络时成对的输入，其输出是两个类间的距离而不是概率。

; 2.孪生神经网络的损失函数

由与孪生神经网络是计算的两个输入的相似度，距离，而不是对输入做分类，因此 交叉商损失函数不适用于此种场景， 孪生神经网络的常用的损失函数有 Triplet Loss和 Contrastive Loss。

2.1 Triplet Loss

Triplet Loss三元组损失函数，其应用见谷歌 2015年发表在 CVPR上的做人脸验证的论文 facenet。该损失函数定义一个三元组作为输入，分别是( X a n c h o r , X p o s i t i v e , X n e g a t i v e ) (X_{anchor},X_{positive},X_{negative})(X a n c h o r ,X p o s i t i v e ,X n e g a t i v e )这三个输入的通过如下方式构成，先从训练数据集中随机选一个样本作为 Anchor,再随机选取一个和 Anchor属于同一类的样本作为正样本X p o s i t i v e X_{positive}X p o s i t i v e ，和一个不同类的样本作为负样本X n e g a t i v e X_{negative}X n e g a t i v e ，通过这种方式定义一个输入的三元组( X a n c h o r , X p o s i t i v e , X n e g a t i v e ) (X_{anchor},X_{positive},X_{negative})(X a n c h o r ,X p o s i t i v e ,X n e g a t i v e )，将其输入到网络可以得到对应的特征向量[ f ( X a n c h o r ) , f ( X p o s i t i v e ) , f ( X n e g a t i v e ) ] [f(X_{anchor}),f(X_{positive}),f(X_{negative})][f (X a n c h o r ),f (X p o s i t i v e ),f (X n e g a t i v e )], Triplet Loss的目的是通过训练，使得同种类别的距离更近，不通类别的距离更大，即 拉近anchor与positive推远anchor和negative,如下图：

图片来自FaceNet论文

通过这种相似度比较式的学习，模型不仅与同类别更像，还学会了与不同类别增大区分度的信息。通常定义一个α \alpha α,使得 Anchor距离 Negative的距离比距离 Positive大α \alpha α,公式化表示为：

∣ ∣ f ( X a n c h o r ) − f ( X n e g a t i v e ) ∣ ∣ − ∣ ∣ f ( X a n c h o r ) − f ( X p o s i t i v e ) ∣ ∣ > α ||f(X_{anchor}) – f(X_{negative})|| – ||f(X_{anchor}) – f(X_{positive})|| \gt \alpha ∣∣f (X a n c h o r )−f (X n e g a t i v e )∣∣−∣∣f (X a n c h o r )−f (X p o s i t i v e )∣∣>α

定义为：

L ( X a n c h o r , X p o s i t i v e , X n e g a t i v e ) = m a x ( ∣ ∣ f ( X a n c h o r ) − f ( X p o s i t i v e ) ∣ ∣ − ∣ ∣ f ( X a n c h o r ) − f ( X n e g a t i v e ) ∣ ∣ + α , 0 ) L(X_{anchor}, X_{positive}, X_{negative}) = max(||f(X_{anchor}) – f(X_{positive})|| – ||f(X_{anchor}) – f(X_{negative})|| + \alpha, 0)L (X a n c h o r ,X p o s i t i v e ,X n e g a t i v e )=m a x (∣∣f (X a n c h o r )−f (X p o s i t i v e )∣∣−∣∣f (X a n c h o r )−f (X n e g a t i v e )∣∣+α,0 )

; 2.2 Contrastive Loss

衡量相似度的另一常用函数是 Yann Lecun在 2005年的一篇论文Dimensionality Reduction by Learning an Invariant Mapping中使用的 Contrastive Loss。

Contrastive Loss的输入是一对样本，基于相似的一对对象特征距离应该更小，不相似的一对对象特征距离应该较大来计算。从数据中选一对样本( X a , X b ) (X_a, X_b)(X a ,X b ),这两个样本的 欧式距离表示为d = ∣ ∣ X a − X b ∣ ∣ 2 = ( X a − X b ) 2 d=||X_a-X_b||_2=\sqrt{({X_a-X_b})^2}d =∣∣X a −X b ∣∣2 =(X a −X b )2 ,则 Contrastive Loss可表示为：
L ( X a , X b ) = ( 1 − Y ) 1 2 d 2 + Y 1 2 { m a x ( 0 , m − d ) } 2 L(X_a,X_b) = (1-Y)\frac{1}{2}d^2 + Y\frac{1}{2}{max(0, m-d)}^2 L (X a ,X b )=(1 −Y )2 1 d 2 +Y 2 1 {m a x (0 ,m −d )}2

Y表示( X a , X b ) (X_a,X_b)(X a ,X b )是否匹配，匹配为 1不匹配为 0
m是设置的 安全距离，当( X a , X b ) (X_a, X_b)(X a ,X b )的距离小于m m m时， Contrasive Loss将变成 0，这使得X a X_a X a 与X b X_b X b 相似而不是相同，能保证算法的泛化能力

3.动手实现一个孪生网络

3.1 网络结构

这里使用 Contrasive Loss定义一个孪生神经网络，网络结构如图:

这里上下两个网络使用同一个网络来实现，对于两个输入，每一步推理使用相同的权重 forward两次，然后计算损失函数更新权重，这里并没有定义两个网络。为了简化训练，自定义了比较小的网络

class SiameseNetwork(nn.Module):
    """Custom Siamese Network
"""
    def __init__(self):
        super(SiameseNetwork, self).__init__()

        self.cnn = nn.Sequential(
            nn.Conv2d(1, 128, kernel_size=5, stride=3, padding=2),
            nn.ReLU(inplace=True),
            nn.LocalResponseNorm(5, alpha=0.001, beta=.75, k=2),
            nn.MaxPool2d(4, stride=2),
            nn.Dropout2d(p=.5),
        )

        self.fc = nn.Sequential(
            nn.Linear(2048, 512),
            nn.ReLU(inplace=True),
            nn.Dropout2d(p=0.5),
            nn.Linear(512, 128),
            nn.ReLU(inplace=True),
            nn.Linear(128, 2)
        )

    def forward_once(self, x):
        y = self.cnn(x)
        y = y.view(y.size()[0], -1)
        y = self.fc(y)
        return y

    def forward(self, x1, x2):
        y1 = self.forward_once(x1)
        y2 = self.forward_once(x2)
        return y1, y2

3.2 损失函数

损失函数使用的是前述的 Contrastive Loss,其定义为：

class ContrastiveLoss(torch.nn.Module):

    def __init__(self, margin):
        super(ContrastiveLoss, self).__init__()
        self.margin = margin

    def forward(self, x1, x2, y):
        dist = F.pairwise_distance(x1, x2)
        total_loss = (1-y) * torch.pow(dist, 2) + \
            y * torch.pow(torch.clamp_min_(self.margin - dist, 0), 2)
        loss = torch.mean(total_loss)
        return loss

3.3 数据

这里使用的是基于 MNIST数据集随机选取的 1000张图像然后生成了 8000对作为输入来训练的，测试时输入两张手写字图片输出其相似度。

3.4 训练结果

训练了 20个 epoch,损失函数值的变化趋势如下图：

由于使用的 batch_size较小，迭代的次数较少，可以看到损失函数没有很好的收敛。且打开训练数据看了下自己生成的 train.csv中的图像对，绝大部分 label都是 0，存在严重的数据不平衡问题，需要改进。在测试数据上的输出，对于有些输入可以比较好的衡量其相似度。

Predicted Distance:     0.0020178589038550854
Actual Label:   Different Signature

Predicted Distance:     0.0002805054828058928
Actual Label:   Same Signature

Predicted Distance:     0.003011130029335618
Actual Label:   Different Signature

Predicted Distance:     0.0018709745490923524
Actual Label:   Different Signature

完整代码见gitee仓库

4.SiameseNetWork的一些应用

1.签名验证Signature Verification using a “Siamese”
Time Delay Neural Network

2.三胞胎网络Deep metric learning using Triplet network

3.One-ShotLearning， Siamese Neural Networks for One-shot Image Recognition

4.人脸验证Learning a Similarity Metric Discriminatively, with Application to Face
Verification

参考资料

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

Original: https://blog.csdn.net/lx_ros/article/details/124439120
Author: 恒友成
Title: (四)孪生神经网络介绍及pytorch实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/646521/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于keras的残差网络实现——以fashion mnist数据集分类为例

基于keras的残差网络实现——以fashion mnist数据集分类为例前言残差网络 * 残差块残差网络 fashion-mnist数据集代码实现结果展示 * 模型结构…

人工智能 2023年7月1日
0077
OpenCV学习笔记10-图像轮廓的相关知识及代码实现

文章目录 1 什么是图像轮廓 2 查找轮廓 3 绘制轮廓 4 轮廓的面积和周长 5 多边形逼近与凸包 6 外接矩形 1 什么是图像轮廓图像轮廓是具有相同颜色或灰度的连续点的曲线….

人工智能 2023年7月20日
0076
Android端实现多人视频语音聊天｜音视频开发

1 多人视频通话功能本文展示了如何使用即构实时音视频SDK ZEGO Express SDK 构造多人视频通话场景，即实现多对多实时音视频互动。用户可在房间内与其余用户进行实时…

人工智能 2023年6月3日
00114
SSD论文解读

Abstract： SSD在许多特定位置生成具有不同的高宽比和size的锚框，通过预测锚框的类别和与与之对应真实边缘框的偏差来训练网络。SSD可以实现多尺度目标检测。SSD比two…

人工智能 2023年7月9日
0097
MySQL和Oracle的分页

MySQL使用limit进行分页 select * from stu limit m,n; // m=(pageIndex-1)*pageSize,n=pageSize — 返回…

人工智能 2023年6月26日
0065
深度学习：使用nanodet训练自己制作的数据集并测试模型，通俗易懂，适合小白

关于目标检测的模型有很多， nanodet模型小且轻量化，适合移植部署到硬件设备上，非常推荐学习这个模型。经过我自己踩了无数坑后总结了此教程，助学刚接触nanodet，想要快速上手…

人工智能 2023年7月18日
0060
python中pandas用法iloc_在Python中使用Pandas .iloc []提取行

Pandas是著名的python库，已广泛用于python中的数据处理和分析。在本文中，我们将看到如何使用.iloc方法，该方法用于通过过滤数据帧中的行和列从python中读取选择…

人工智能 2023年7月8日
0088
机器学习开发环境安装 Tensorflow 2.5.0 + Cuda 11.2 + cudnn 8.1 (windows)

同步发于 JuzerTech网站，里面有我软、硬件学习的纪录与科技产品开箱，欢迎进去观看。随着机器学习的兴起，越来越多人投入机器学习的开发。环境开发便是这条旅途的第一站，今天介…

人工智能 2023年5月26日
0074
猿创征文｜弃文从工，从小白到蚂蚁工程师，我的 Java 成长之路

; 一、前言 1.1 背景最近 CSDN 开展了猿创征文，希望博主写文章讲述自己在某个领域的技术成长历程。之前也曾想找个机会写篇文章，记录下自己的成长历程。因此，借着这个机会写下…

人工智能 2023年5月30日
00111
【Linux】—一文掌握Linux基本命令（上）

目录 ls pwd cd touch mkdir rmdir与rm man tree 的安装 cp mv nano的安装 cat ls 语法： ls [选项][目录或文件]功能： …

人工智能 2023年7月30日
0048
【机器学习】SVM实例——对glass数据集进行分类处理实验详解

【机器学习】SVM实例——对glass数据集进行分类处理一、SVM是什么？ * 1.线性可分 2.最大间隔超平面 3.支持向量 4.SVM最优化问题 5.具体求解步骤 &#821…

人工智能 2023年7月1日
0099
山东大学类脑实验五 HMAX 模型实现

山东大学类脑实验五 HMAX 模型实现实验目的：加深对 HMAX 模型的理解，能够使用 HMAX 模型解决简单问题实验内容：根据 HMAX 模型的相关知识，使用 Pyth…

人工智能 2023年6月25日
0081
Python类的多种方法，你分得清吗？

在初学Python过程中，会遇到这样的概念，一个类下面会有多个方法，有的叫类方法、有的叫静态方法，还有的叫实例方法。当调用他们的时候，不免会有点蒙圈，那么他们之间的区别是什么呢？ …

人工智能 2023年6月27日
0075
【OpenCV4】拉普拉斯算子提取边缘 cv::Laplacian() 用法详解和代码示例（c++）

作用原理：拉普拉斯算子可以用于边缘检测，同时该算子不具有方向性，可以同时检测到 X 方向和 Y 方向的边缘，综合后检测出图像的边缘。即拉普拉斯算子是各向同性的，这在很多情况…

人工智能 2023年7月20日
0082
Python中 if 语句及其使用

文章目录前言一、条件测试 * 1.比较字符串相等或不相等 2.比较数字 3.检查多个条件 4.检查特定值是否在列表中二、if 语句 * 1.简单的if语句 2. if-el…

人工智能 2023年7月4日
0067
VScode常用插件_AE必备插件

文章目录 * – 官网地址 – 基础插件 – + html CSS Support + HTML Snippets + HTMLHint + s…

人工智能 2023年6月27日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31