TripletMarginLoss原理和源码实现

2023年5月30日下午9:30 • 人工智能 • 阅读 66

TripletMarginLoss最早是在 FaceNet 提出的，它是用于衡量不同人脸特征之间的距离，进而实现人脸识别和聚类

现在被广泛应用于不同业务场景中，比如推荐场景和搜索场景下的向量召回模型。TripletMarginLoss的公司如下：L ( a , p , n ) = m a x { d ( a , p ) − d ( a , n ) + m a r g e , 0 } L(a,p,n)=max{d(a,p)-d(a,n)+marge,0}L (a ,p ,n )=m a x {d (a ,p )−d (a ,n )+m a r g e ,0 },其中d默认表示欧氏距离。
该Loss针对不同样本配对，有以下三种情况：
1.简单样本，即d ( a i , p i ) − d ( a i , n i ) + m a r g e < 0 d(a_i,p_i)-d(a_i,n_i)+marge此时正样本距离anchor的距离d ( a i , p i ) + M a r g i n d(a_i, p_i) + Margin d (a i ,p i )+M a r g i n仍然小于负样本距离anchor的距离d ( a i , n i ) d(a_i, n_i)d (a i ,n i ),该情况认为正样本距离足够小，不需要进行优化，因此Loss为0;

2.难样本，即d ( a i , p i ) − d ( a i , n i ) > 0 d(a_i,p_i)-d(a_i,n_i)>0 d (a i ,p i )−d (a i ,n i )>0此时负样本距离anchor的距离d ( a i , n i ) d(a_i, n_i)d (a i ,n i ) 小于正样本距离anchor的距离d ( a i , p i ) d(a_i, p_i)d (a i ,p i )，需要进行优化。

半难样本，即d ( a i , p i ) − d ( a i , n i ) < 0 并且 d ( a i , p i ) − d ( a i , n i ) + m a r g e > 0 d(a_i,p_i)-d(a_i,n_i)d (a i ,p i )−d (a i ,n i )<0 并且d (a i ,p i )−d (a i ,n i )+m a r g e >0此时虽然负样本距离anchor的距离$d(a_i, n_i) 大于正样本距离 a n c h o r 的距离大于正样本距离anchor的距离大于正样本距离a n c h o r 的距离d(a_i, p_i)$，但是还不够大，没有超过 Margin，需要优化。

此外论文作者还提出了 swap 这个概念，原因是我们公式里只考虑了anchor距离正类和负类的距离，而没有考虑正类和负类之间的距离，考虑以下情况：

可能Anchor距离正样本和负样本的距离相同，但是负样本和正样本的距离很近，不利于模型区分，因此会做一个swap，即交换操作，在代码里体现的操作是取最小值。


if swap:
    D(a, n) = min(D(a,n), D(p, n))

这样取了最小值后，在Loss计算公式中，Loss值会增大，进一步帮助区分负样本。下面是numpy的对应代码:

def np_triplet_margin_loss(anchor, postive, negative, margin, swap, reduction="mean", p=2, eps=1e-6):
    def _np_distance(input1, input2, p, eps):

        np_pnorm = np.power(np.abs((input1 - input2 + eps)), p)
        np_pnorm = np.power(np.sum(np_pnorm, axis=-1), 1.0 / p)
        return np_pnorm

    dist_pos = _np_distance(anchor, postive, p, eps)
    dist_neg = _np_distance(anchor, negative, p, eps)

    if swap:
        dist_swap = _np_distance(postive, negative, p, eps)
        dist_neg = np.minimum(dist_neg, dist_swap)
    output = np.maximum(margin + dist_pos - dist_neg, 0)

    if reduction == "mean":
        return np.mean(output)
    elif reduction == "sum":
        return np.sum(output)
    else:
        return output

Original: https://blog.csdn.net/qq_40176087/article/details/123590777
Author: 谈笑风生…
Title: TripletMarginLoss原理和源码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/545207/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于Opencv实现的简易汉字识别

使用C++结合Opencv库实现简易汉字识别。文章目录 Opencv实现汉字识别 * 程序实现思路 – 图像预处理 + 思路实现实例对比方法模型训练识别过程 …

人工智能 2023年6月18日
0092
Linux | 如何使用 cURL 发送 POST 请求

1 概述 Curl 是一个命令行实用程序，允许用户创建网络请求。Curl 在 Windows、 Linux 和 Mac 上皆可使用，这使它成为开发人员的首选。在本文中，我们将解释…

人工智能 2023年7月29日
00167
(ROS_Melodic) 使用Rviz进行Boundingbox可视化

(ROS_Melodic) 使用Rviz进行Boundingbox可视化 先赞后看&…

人工智能 2023年6月10日
0096
基于垂直领域语料，使用MaskLM任务预训练Bert模型

项目介绍使用Mask LM预训练任务来预训练Bert模型。基于pytorch框架，训练关于垂直领域语料的预训练语言模型，目的是提升下游任务的表现。代码及示例数据：https:…

人工智能 2023年5月28日
0080
现在能聊天的机器人都有哪些？

聊天机器人，是一个用来模拟人类对话或聊天的程序。互联网时代，让人人都能够通过电脑和世界各地的人互联，移动互联网时代则让手机成为了每个人的标配，而AI时代，聊天机器人已成为了新一代…

人工智能 2023年6月1日
0079
图像处理之图像直方图

图像处理之图像直方图 1、什么是图像灰度直方图？什么是直方图均衡化？什么是直方图规定化？灰度直方图：从数学上来说，图像直方图是描述图像的各个灰度级的统计特性，它是图像灰度值…

人工智能 2023年6月18日
00122
决策树之基尼指数理解

基尼指数和信息熵都是用来描述系统混乱度的量数学形式不一样，干的事是一样的不纯度（impurity）–GINI系数：（不纯度就是混乱度）公式例子（与信息熵干的是一…

人工智能 2023年6月15日
00107
【点云处理】PointNet++点云分类与分割

PointNet++网络详解一、PointNet++改进思想关于PointNet可以参考前一篇文档。前文中已经提到，PointNet并没有做局部特征提取，而是通过最大池化层获…

人工智能 2023年6月30日
0094
python kfold交叉验证_kfold交叉验证python

我是python的初学者。我写了下面的函数来分区从csv文件读取的数据。索引生成没有错误，但是当我用这个索引拆分df时，结果是不正确的。我的代码怎么了？在def partition…

人工智能 2023年7月8日
0063
【项目实战课】快速上手目标检测任务，MMdetection框架详细解读与案例实战

欢迎大家来到我们的项目实战课，本期内容是《MMdetection框架解读与案例实战》。所谓项目实战课，就是以简单的原理回顾+详细的项目实战的模式，针对具体的某一个主题，进行代码级…

人工智能 2023年7月10日
0057
运用爬虫和neo4j数据库制作体育人物图谱（demo）

运用爬虫和neo4j数据库制作体育人物图谱（demo）总体思路：从虎扑网站爬取体育人物列表，再通过人物列表去百度百科爬取人物关系列表，将两个文件都以 csv格式保存，导入neo4…

人工智能 2023年6月1日
00112
35道最新【软件测试】面试题，常见面试题及答案汇总

前言除了掌握扎实的专业技能之外，你还需要一份《软件测试面试宝典2022版》才能在万千面试者中杀出重围，成功拿下offer。小编特意整理了35道测试必问必过面试题，送给大家，希望…

人工智能 2023年6月27日
0070
【轻量化深度学习】知识蒸馏与NLP语言模型的结合

Knowledge Distillation Student : Wenxuan Zeng School : University of Electronic Science an…

人工智能 2023年5月27日
0084
（学习笔记）十大经典算法——K-means聚类算法

概述聚类算法是在无监督的情况下将对象自动分组的一种分析方法，典型的聚类算法分为三个阶段：特征选择和特征提取，数据对象间相似度计算，根据相似度将数据对象分组。聚类算法的目标是将数据…

人工智能 2023年5月31日
00124
弗洛伊德（Floyd)算法详解

Floyd 算法是解决图论问题的比较经典的算法，用来求解赋权图中每对顶点间的最短距离。当然，在求距离的过程中也可以得到最短距离的路径。这个算法与迪杰斯特拉（Dijkstra)算法相…

人工智能 2023年7月5日
0073
计算机分类及性能描述

文章目录计算机分类及性能描述 * 一.计算机的分类 – 1.按用途分 2.Flynn分类法二.计算机的性能指标 – 1.字长 2.数据通路带宽 3.主存…

人工智能 2023年7月1日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TripletMarginLoss原理和源码实现

大家都在看