机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

2023年7月26日上午10:49 • 人工智能 • 阅读 145

Wasserstein距离也被称为推土机距离（Earth Mover’s Distance，EMD），用来表示两个分布的相似程度。Wasserstein距离衡量了把数据从分布p p p移动成”分布q q q时所需要移动的平均距离的最小值。Wasserstein距离是2000年IJCV期刊文章《The Earth Mover’s Distance as a Metric for Image Retrieval》提出的一种直方图相似度量。如果两个分布p p p和q q q离得很远，完全没有重叠的时候，那么KL散度值是没有意义的，而JS散度值是一个常数。这在学习算法中是比较致命的，这就意味这这一点的梯度为0，即梯度消失，而Wasserstein距离可以解决这个问题。

我们将两个分布p p p和q q q看成两堆土，如下图所示，希望把其中的一堆土移成另一堆土的位置和形状，有很多种可能的方案。推土代价被定义为移动土的量乘以土移动的距离，在所有的方案中，存在一种推土代价最小的方案，这个代价就称为两个分布的Wasserstein距离。

机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

Wasserstein距离的形式化的表达式如下：
W ( p , q ) = inf ⁡ γ ∼ ∏ ( p , q ) E x , y ∼ γ [ ∣ ∣ x − y ∣ ∣ ] W(p, q)=\inf_{\gamma\sim\prod(p,q)}E_{x, y\sim\gamma}[||x-y||]W (p ,q )=γ∼∏(p ,q )in f E x ,y ∼γ[∣∣x −y ∣∣]

其中， ∏ ( p , q ) \prod(p,q)∏(p ,q )表示分布p p p和q q q组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布γ \gamma γ可以从中采样( x , y ) ∼ γ (x, y)\sim\gamma (x ,y )∼γ得到一个样本x x x和 y，并计算出这对样本的距离∣ ∣ x − y ∣ ∣ ||x-y||∣∣x −y ∣∣，所以可以计算该联合分布γ \gamma γ下，样本对距离的期望值E x , y ∼ γ [ ∣ ∣ x − y ∣ ∣ ] E_{x, y\sim\gamma}[||x-y||]E x ,y ∼γ[∣∣x −y ∣∣]。在所有可能的联合分布中能够对这个期望值取到的下界就是Wasserstein距离。用推土的方式理解就是，E x , y ∼ γ [ ∣ ∣ x − y ∣ ∣ ] E_{x, y\sim\gamma}[||x-y||]E x ,y ∼γ[∣∣x −y ∣∣]是在γ \gamma γ这种路径规划下，把p p p这堆土，移成q q q的样子的消耗，而Wasserstein距离就是在”最优路径规划”下的最小消耗。

Original: https://blog.csdn.net/hy592070616/article/details/122396193
Author: von Neumann
Title: 机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/716754/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

单目相机标定结果的评估——重投影误差与畸变校正

目录 1.重投影误差的概念 2.基于摄像机模型的重投影误差 3.畸变校正算法 3.1利用畸变模型正向求解 3.2利用畸变模型反向求解 1.重投影误差的概念在相机标定后，我们可以通…

人工智能 2023年6月17日
00321
【深度学习】全连接层

4.5 全连接层全连接层是一个列向量(单个样本)。通常用于深度神经网络的后面几层，用于图像分类任务。全连接层，是每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起…

人工智能 2023年6月16日
00150
java计算机毕业设计二手车交易平台源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0053
tensorflow踩坑合集2. TF Serving & gRPC 踩坑

这一章我们借着之前的NER的模型聊聊tensorflow serving，以及gRPC调用要注意的点。以下代码为了方便理解做了简化，完整代码详见Github-ChineseNER …

人工智能 2023年6月4日
0088
C++使用onnxruntime/opencv对onnx模型进行推理(附代码)

文章目录 0. onnx模型准备以及测试图 1. c++使用onnxruntime进行推理 2. c++使用opencv进行推理 3. 完整代码 4. c++调用tensorRT的…

人工智能 2023年7月21日
0054
机器学习基础知识

文章目录概述一、机器学习分类 * 1.1 主要任务 1.2 分类方式 1.3 监督学习 – 1.3.1 判别式模型 1.3.2 生成式模型 1.4 无监督学习 &#…

人工智能 2023年6月17日
0091
通过循环查找完数

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月27日
0090
李宏毅机器学习（八）ELMo、BERT、GPT、XLNet、MASS、BART、UniLM、ELECTRA、others

怎么得到这个pre-train好的模型呢？ Pre-training by Translation（翻译） Context Vector（CoVe）：Embedding的words…

人工智能 2023年6月1日
00122
密码学奇妙之旅、03 HMAC单向散列消息认证码、Golang代码

HMAC 单向散列消息认证码消息认证码MAC是用于确认完整性并进行认证的技术，消息认证码的输入包括任意长度的消息和一个发送者和接收者之间共享的密钥（可能还需要共享盐值）。 HMA…

人工智能 2023年6月4日
00100
pandas的拼接操作

pandas的拼接分为两种：级联：pd.concat, pd.append 合并：pd.merge 1. 使用pd.concat()级联 def make_df(index,co…

人工智能 2023年7月7日
0055
从零开始的数模学习（特别篇）：Pandas数据处理入门

1 Pandas 数据处理基础 1.1 介绍 Pandas是非常著名的开源数据处理库，我们可以通过它完成对数据集的快速读取、转换、过滤、分析等一系列操作。除此之外，Pandas拥…

人工智能 2023年7月6日
0053
MySQL远程链接踩坑

演示使用 MySQL 版本为 5.7 自行去官网下载并安装 MySQL，默认的数据库访问地址为 localhost:3306 我们使用 navicat 链接数据库，显示为正常链接；…

人工智能 2023年6月26日
0089
GPU驱动、CUDA和cuDNN之间的版本匹配与下载

文章目录 * – GPU驱动、CUDA和cuDNN之间的版本匹配与下载 – + 1. GPU驱动 + 2. CUDA + * 2.1. 查看自己GPU驱动的…

人工智能 2023年7月27日
0090
支持哪些常见的优化器

问题：哪些常见的优化器被支持？介绍在深度学习中，优化器是用来调整模型中可学习参数的算法。优化器的作用是通过最小化或最大化目标函数来使模型的性能达到最优。常见的优化算法有梯度下降…

人工智能 2023年12月31日
0031
【PyTorch基础教程12】图像多分类问题（学不会来打我啊）

学习总结（1）本次图像多分类中的最后一层网络不需要加激活，因为在最后的 Torch.nn.CrossEntropyLoss已经包括了激活函数softmax。这里注意 softma…

人工智能 2023年7月2日
0094
python面试题——抽象基类和接口

; 一、抽象基类与接口 1、抽象基类(abstract base class,ABC) 提到这个概念,我们应该会马上联想到面向对象、继承。作为继承的一种，它拥有继承中代码共享、提高…

人工智能 2023年7月5日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

大家都在看