KL散度详解

2023年6月16日下午12:50 • 人工智能 • 阅读 168

KL散度详解

*
–
+
* 1、KL散度的概念
* 2、两类KL散度拟合效果的定性分析
* 3、两类KL散度拟合效果的数学推导
* 4、KL散度的计算
* 5、KL散度 Python 实现
* 6、References

1、KL散度的概念

KL散度（Kullback-Leibler Divergence）一般用于度量两个概率分布函数之间的”距离”，其定义如下（参考文献[2] 2、[4] 4）：

K L [ P ( X ) ∥ Q ( X ) ] = ∑ x ∈ X [ P ( x ) log ⁡ P ( x ) Q ( x ) ] = E x ∼ P ( x ) [ log ⁡ P ( x ) Q ( x ) ] K L[P(X) \| Q(X)]=\sum_{x \in X}\left[P(x) \log \frac{P(x)}{Q(x)}\right]=E_{x \sim P(x)}\left[\log \frac{P(x)}{Q(x)}\right]K L [P (X )∥Q (X )]=x ∈X ∑[P (x )lo g Q (x )P (x )]=E x ∼P (x )[lo g Q (x )P (x )]

由于KL散度的计算公式中对 x x x 进行了积分（连续型随机变量）或求和（离散型随机变量），因此KL与 x x x 无关，因此也可以记为 K L [ P ∥ Q ] K L[P \| Q]K L [P ∥Q ] 。

注意到KL散度的定义中 K L [ P ( X ) ∥ Q ( X ) ] K L[P(X) \| Q(X)]K L [P (X )∥Q (X )] 关于 P ( X ) P(X)P (X ) 、 Q ( X ) Q(X)Q (X ) 并不对称。根据公式，KL散度不满足对称性，即： K L [ P ( X ) ∥ Q ( X ) ] ≠ K L [ Q ( X ) ∥ P ( X ) ] K L[P(X) \| Q(X)] ≠ K L[Q(X) \| P(X)]K L [P (X )∥Q (X )]=K L [Q (X )∥P (X )] ，因此，KL散度显然不是数学意义上的”度量”。

KL散度的典型应用场景如下：假设某优化问题中, P ( X ) P(X)P (X ) 是真实分布（true distribution）， Q ( X ) Q(X)Q (X ) 是一个用于拟合 P ( X ) P(X)P (X ) 的近似分布（approximate distribution），可以尝试通过修改 Q ( X ) Q(X)Q (X ) 使得二者间的 K L [ P ( X ) ∥ Q ( X ) ] K L[P(X) \| Q(X)]K L [P (X )∥Q (X )] 尽可能小,来实现用 Q ( X ) Q(X)Q (X ) 拟合 P ( X ) P(X)P (X ) ，如下图所示[4]。

在上面的概率拟合应用场景下， K L [ P ( X ) ∥ Q ( X ) ] K L[P(X) \| Q(X)]K L [P (X )∥Q (X )] 也被称为前向KL散度（forward Kullback-Leibler Divergence），将 K L [ Q ( X ) ∥ P ( X ) ] K L[Q(X) \| P(X)]K L [Q (X )∥P (X )] 称为反向KL散度（reverse Kullback-Leibler Divergence）。

这里需要注意的是，只有在概率拟合的应用场景下（也就是确定了真实分布和拟合分布两个角色之后），前向KL散度 K L [ P ( X ) ∥ Q ( X ) ] K L[P(X) \| Q(X)]K L [P (X )∥Q (X )] 和反向KL散度 K L [ Q ( X ) ∥ P ( X ) ] K L[Q(X) \| P(X)]K L [Q (X )∥P (X )] 的定义才是有意义的，否则二者只是相同公式改变正负号、并交换 P P P 和 Q Q Q 符号表示之后的平凡结果。

; 2、两类KL散度拟合效果的定性分析

极小化前向KL代价下的拟合行为特性：寻找均值（Mean-Seeking Behaviour）

前向KL的计算式中， P ( x ) P(x)P (x ) 和 Q ( x ) Q(x)Q (x ) 在每个样本点 x x x 上的差异程度被 P ( x ) P(x)P (x ) 加权平均，我们基于此对前向KL的特性进行分析。

考虑随机变量 X X X 的子集 X 0 = x ∣ P ( x ) = 0 X_0 = { x|P(x) = 0 }X 0 =x ∣P (x )=0 ，由于 P ( x ) P(x)P (x ) 是前向KL公式中的权重系数，因此 X 0 X_0 X 0 中的元素实际上对前向KL的值没有任何影响。换言之，对任意 x ∈ X 0 x \in X_0 x ∈X 0 ，无论 P ( x 0 ) P(x_0)P (x 0 )与 Q ( x 0 ) Q(x_0)Q (x 0 ) 相差多大都对前向KL的计算结果毫无影响，因此前向KL值不受 Q ( x ) Q(x)Q (x ) 在子集 { x ∣ P ( x ) = 0 } {x|P(x) = 0}{x ∣P (x )=0 } 上取值的影响。在极小化前向KL散度的过程中，每当 P ( x ) = 0 P(x) = 0 P (x )=0 ， Q ( x ) Q(x)Q (x ) 就会被无视。从连续性角度推理，最小化前向KL散度倾向于忽视” Q ( x ) Q(x)Q (x ) 在满足 P ( x ) P(x)P (x ) 近似为 0 的随机变量取值集合上的拟合精度”，而去更努力的实现” Q ( x ) Q(x)Q (x ) 在满足 P ( x ) ＞ 0 P(x) ＞ 0 P (x )＞0的随机变量取值集合上的拟合精度”。上述分析结论总结如下：

Wherever P ( ⋅ ) P(·)P (⋅) has high probability, Q ( ⋅ ) Q(·)Q (⋅) must also have high probability. [4]

下图展示了使用前向KL散度代价拟合一个多峰（实际上是双峰）分布的效果示意图（参考文献[4]）。

前向KL散度的这种特性一般也被称为 zero avoiding，原因是它倾向于避免在任何 P ( x ) ＞ 0 P(x) ＞ 0 P (x )＞0的位置x x x 使得 Q ( X ) = 0 Q(X) = 0 Q (X )=0 [4]。

极小化反向KL代价下的拟合行为特性：搜寻模态（Mode-Seeking Behaviour）

在反向KL中，差异加权求和时的权重系数是 Q ( x ) Q(x)Q (x ) 。此时， P ( x ) P(x)P (x ) 在子集 { x ∣ Q ( x ) = 0 } { x|Q(x) = 0 }{x ∣Q (x )=0 } 的取值不影响反向KL值的计算，而当 Q ( x ) ＞ 0 Q(x) ＞0 Q (x )＞0时， Q ( x ) Q(x)Q (x ) 与 P ( x ) P(x)P (x ) 的差异需要尽可能小以使得反向KL值尽可能小。上述分析结论总结如下（参考文献[4]）：

Wherever Q ( ⋅ ) Q(·)Q (⋅) has high probability, P ( ⋅ ) P(·)P (⋅) must also have high probability. [4]

下图展示了使用前向反向KL散度代价拟合一个多峰（实际是双峰）分布的效果示意图（参考文献[4]）。

关于在前向KL拟合特性分析中，为什么说当 P ( x ) P(x)P (x )近似为 0 时，无论 Q ( x ) Q(x)Q (x ) 的取值如何（即使绝对值非常大）,一般都不会对前向KL散度计算产生影响的原因定性的论述如下。

首先，如果当 P ( x ) → 0 P(x) \rightarrow 0 P (x )→0 时，Q ( x ) Q(x)Q (x ) 并不趋近于0，用数学语言可以描述为：存在一个 ε ＞ 0 \varepsilon ＞ 0 ε＞0, 有 Q ( x ) ＞ ε Q(x) ＞ \varepsilon Q (x )＞ε。那么这时一定有

∣ P ( x ) log ⁡ ( Q ( x ) ) ∣ < ∣ P ( x ) log ⁡ ε ∣ → 0 |P(x) \log (Q(x))|

这说明，当概率分布 Q ( x ) Q(x)Q (x )有下大于0的下界（注意：由于 Q Q Q 是概率分布，所以 Q ( x ) Q(x)Q (x ) 取值本就一定在 [0 , 1 0,1 0 ,1] 上）时，P ( x ) log ⁡ ( Q ( x ) ) P(x) \log (Q(x))P (x )lo g (Q (x )) 在 P ( x ) P(x)P (x ) 近似为0时实际可忽略的。

其次，考虑如果 Q ( x ) Q(x)Q (x ) 也趋向于０，也就是 ∣ l o g Q ( x ) ∣ → ∞ |logQ(x)| \to \infty ∣l o g Q (x )∣→∞ 时， P ( x ) log ⁡ ( Q ( x ) ) P(x) \log (Q(x))P (x )lo g (Q (x )) 的极限是否还是0？具体是如下问题：假设当 P → 0 P \to 0 P →0 时，也有 Q → 0 Q \to 0 Q →0 ，且二者趋于0的”速度”是相近的，求 P ( x ) log ⁡ ( Q ( x ) ) P(x) \log (Q(x))P (x )lo g (Q (x )) 的极限。不妨将该问题按如下方法求解：
lim ⁡ x → 0 x ln ⁡ x = lim ⁡ n → ∞ 1 n ln ⁡ 1 n = − lim ⁡ n → ∞ ln ⁡ n n = 0 \lim {x \rightarrow 0} x \ln x=\lim {n \rightarrow \infty} \frac{1}{n} \ln \frac{1}{n}=-\lim _{n \rightarrow \infty} \frac{\ln n}{n}=0 x →0 lim x ln x =n →∞lim n 1 ln n 1 =−n →∞lim n ln n =0

上面的定性证明过程中的第一个等号左边的表达式，其实也可以使用洛必达法则（L’Hospital’s rule）求解。该证明的意义在于说明：若 P l o g Q PlogQ P l o g Q 中的 P P P 和 Q Q Q 以近似相同的速度趋向于0，则 P l o g Q PlogQ P l o g Q 也会趋向于0。这背后隐含的意义是：只要 P ( x ) P(x)P (x ) 在 x x x 处接近于0，那么 Q ( x ) Q(x)Q (x ) 无论取何值（这里的”无论”是指 Q Q Q 有大于0的下界或至多是 P P P 的等价无穷小量），那么 P ( x ) l o g ( Q ( x ) ) P(x)log(Q(x))P (x )l o g (Q (x )) 就是可忽略的。这也就定性的证明，在拟合中 Q Q Q 在在 P ( x ) P(x)P (x ) 中接近于0的那部分自变量集合上花费精力基本是无意义的，因此拟合结果 Q Q Q 会表现为倾向于拟合 P ＞ 0 P ＞ 0 P ＞0 的那些区域。

其他示例

前向KL和反向KL拟合效果的二维多峰（实际上是双峰 P P P ）分布情况示例（参考文献[1]）：

上面图中蓝色的轮廓线代表一个有两个高斯分布组成双峰分布 P ( x ) P(x)P (x ) ，红色的轮廓线是使用单一高斯分布在最小化KL散度意义下对 P ( x ) P(x)P (x ) 进行拟合得到的最佳结果。其中图(a)是拟合代价选择前向KL散度 [公式] 时的拟合效果，图(b)时拟合代价选择反向KL散度 K L ( P ∣ ∣ Q ) KL(P||Q)K L (P ∣∣Q ) 时的拟合效果，图©和图(b)使用相同的代价但展示的是到达反向KL散度代价的另外一个局部极小值点的效果。

; 3、两类KL散度拟合效果的数学推导

考虑到需要用人工设计的近似分布 Q θ ( X ) Q_{\theta }(X)Q θ(X ) 来拟合真实分布 P ( x ) P(x)P (x ) ，这里下标 θ \theta θ 强调 Q ( x ) Q(x)Q (x ) 是一个受到参数 θ \theta θ控制的分布。例如： Q ( x ) Q(x)Q (x ) 是正态分布 N ( μ , σ 2 ) N(\mu ,\sigma^2 )N (μ,σ2 ) ， P P P是正态分布 N ( μ , σ 0 2 ) N(\mu ,\sigma_0^2 )N (μ,σ0 2 ) ，现在希望用 Q Q Q 来拟合 P P P ，其中 Q Q Q 的均值和方差 { μ , σ 2 } {\mu ,\sigma^2}{μ,σ2 } 就是拟合过程中可以调整的参数 θ \theta θ 。于是基于前向KL和反向KL代价的分布拟合问题分别转化为以下两个优化问题（参考文献[4]）：

命题1. 极小化前向KL：arg ⁡ min ⁡ θ K L ( P ∣ ∣ Q θ ) \arg \min {\theta} KL(P||Q{{\theta}})ar g min θK L (P ∣∣Q θ)等价于对参数 θ {\theta}θ 的极大似然估计。

命题2. 极小化反向KL： arg ⁡ min ⁡ θ K L ( Q θ ∣ ∣ P ) \arg \min {\theta} KL(Q{{\theta}}||P)ar g min θK L (Q θ∣∣P ) 相当于在要求 Q θ Q_{{\theta}}Q θ在拟合 P P P 的同时尽可能保持单一模态。

首先，证明命题一，过程如下：

arg ⁡ min ⁡ θ K L ( P ∣ ∣ Q ) = arg ⁡ min ⁡ θ ( E X ∼ P [ − log ⁡ Q θ ( X ) ] ) + H ( P ( X ) ) \arg \min {\theta} KL(P||Q) = \arg \min {\theta}\left(E_{X \sim P}\left[-\log Q_{\theta}(X)\right]\right)+H(P(X))ar g θmin K L (P ∣∣Q )=ar g θmin (E X ∼P [−lo g Q θ(X )])+H (P (X ))
= arg ⁡ min ⁡ θ E X ∼ P [ − log ⁡ Q θ ( X ) ] =\arg \min {\theta} E{X \sim P}\left[-\log Q_{\theta}(X)\right]=ar g θmin E X ∼P [−lo g Q θ(X )]
= arg ⁡ max ⁡ θ E X ∼ P [ log ⁡ Q θ ( X ) ] =\arg \max {\theta} E{X \sim P}\left[\log Q_{\theta}(X)\right]=ar g θmax E X ∼P [lo g Q θ(X )]
≈ arg ⁡ max ⁡ θ E X ∼ P data [ log ⁡ Q θ ( X ) ] \approx \arg \max {\theta} E{X \sim P_{\text {data }}}\left[\log Q_{\theta}(X)\right]≈ar g θmax E X ∼P data [lo g Q θ(X )]

其中 H ( P ( X ) ) = − ∑ x [ P ( x ) log ⁡ P ( x ) ] H(P(X))=-\sum_{x}[P(x) \log P(x)]H (P (X ))=−∑x [P (x )lo g P (x )]，代表信息熵（Entropy）。上述推导的最终结果正好就是极大似然代价的定义式。

推导过程分析：上面的推导过程中，第2行到第3行利用了 H ( P ( X ) ) H(P(X))H (P (X )) 是与优化自变量 θ \theta θ 无关的，故删除该项不会改变最优化问题的解，因此可以直接省略。第3行到第4行则是通过来将求最小值问题转化为求最大值问题消去负号。第4行到第5行利用了机器学习训练中一般假设特征在样本集上的分布可以被近似看作真实分布，即： H ( P ( X ) ) = − ∑ x [ P ( x ) log ⁡ P ( x ) ] H(P(X))=-\sum_{x}[P(x) \log P(x)]H (P (X ))=−∑x [P (x )lo g P (x )] 。

综上命题1成立。

其次，证明命题2，推导如下：

arg ⁡ min ⁡ θ K L ( P ∣ ∣ Q ) = arg ⁡ min ⁡ θ ( E X ∼ P [ − log ⁡ Q θ ( X ) ] ) + H ( Q θ ( X ) ) \arg \min {\theta} KL(P||Q) = \arg \min {\theta}\left(E_{X \sim P}\left[-\log Q_{\theta}(X)\right]\right)+H(Q_{\theta}(X))ar g θmin K L (P ∣∣Q )=ar g θmin (E X ∼P [−lo g Q θ(X )])+H (Q θ(X ))

观察上面的等式右侧 [公式] 中的两项：

E X ∼ Q θ [ − log ⁡ P ( X ) ] + H ( Q θ ( X ) ) E_{X \sim Q_{\theta}}[-\log P(X)]+H\left(Q_{\theta}(X)\right)E X ∼Q θ[−lo g P (X )]+H (Q θ(X ))

要想令上面两项之和最小，就意味着要找到参数 θ {\theta}θ 的一个合适的取值，使得上面两项中的每一项 E X ∼ Q θ [ − log ⁡ P ( X ) ] E_{X \sim Q_{\theta}}[-\log P(X)]E X ∼Q θ[−lo g P (X )] 和 H ( Q θ ( X ) ) H\left(Q_{\theta}(X)\right)H (Q θ(X )) 都尽可能小。根据熵的性质可知，当 Q θ Q_{{\theta}}Q θ 越接近于均匀分布（当X X X 是连续随机变量时，若 X X X 是离散型随机变量便是离散取值的等概率分布，总之就是都可以看作等高多峰分布的极限情况）第二项 H ( Q θ ( X ) ) H\left(Q_{\theta}(X)\right)H (Q θ(X )) 的值越大，反之当 Q θ Q_{{\theta}}Q θ 越去向于单一模态分布（可以通俗理解为单峰分布） H ( Q θ ( X ) ) H\left(Q_{\theta}(X)\right)H (Q θ(X )) 的值越小。因此反向KL散度相当于在要求 Q θ Q_{{\theta}}Q θ 在拟合 P P P 的同时尽可能保持单一模态。

综上命题2成立。

4、KL散度的计算

考虑有两个样本分布 P P P 和 Q Q Q 如下：

取值类型
x 1 x_1 x 1 x 2 x_2 x 2 x 3 x_3 x 3 x 4 x_4 x 4 P P P

3/51/52/50
Q Q Q

5/93/901/9

由于 P P P 和 Q Q Q 中都在某个取值上概率为 0，因此直接计算前向KL散度和反向KL散度

K L forward ( P ∥ Q ) = ∑ i = 1 4 [ P ( x i ) log ⁡ P ( x i ) Q ( x i ) ] K L_{\text {forward }}(P \| Q)=\sum_{i=1}^{4}\left[P\left(x_{i}\right) \log \frac{P\left(x_{i}\right)}{Q\left(x_{i}\right)}\right]K L forward (P ∥Q )=i =1 ∑4 [P (x i )lo g Q (x i )P (x i )]
K L backward ( Q ∥ P ) = ∑ i = 1 4 [ Q ( x i ) log ⁡ Q ( x i ) P ( x i ) ] K L_{\text {backward }}(Q \| P)=\sum_{i=1}^{4}\left[Q\left(x_{i}\right) \log \frac{Q\left(x_{i}\right)}{P\left(x_{i}\right)}\right]K L backward (Q ∥P )=i =1 ∑4 [Q (x i )lo g P (x i )Q (x i )]

都会由于遇到分母为 0 的问题导致不可行。为此，介绍计算KL散度的平滑（Smoothing）方法[5]：

引入一个微小常量 ε \varepsilon ε，例如： ε = 1 0 − 3 \varepsilon=10^{-3}ε=1 0 −3 ，然后定义平滑的分布 P ′ P’P ′ 和 Q ′ Q’Q ′ 如下：

取值类型
x 1 x_1 x 1 x 2 x_2 x 2 x 3 x_3 x 3 x 4 x_4 x 4 P P P 3 / 5 − ε / 3 3/5 – \varepsilon/3 3 /5 −ε/3 1 / 5 − ε / 3 1/5 – \varepsilon/3 1 /5 −ε/3 2 / 5 − ε / 3 2/5 – \varepsilon/3 2 /5 −ε/3 ε \varepsilon εQ Q Q 5 / 9 − ε / 3 5/9 – \varepsilon/3 5 /9 −ε/3 3 / 9 − ε / 3 3/9 – \varepsilon/3 3 /9 −ε/3 ε \varepsilon ε1 / 9 − ε / 3 1/9 – \varepsilon/3 1 /9 −ε/3

分别用 K L forward ( P ′ ∥ Q ′ ) K L_{\text {forward }}(P’ \| Q’)K L forward (P ′∥Q ′) 和 K L backword ( P ′ ∥ Q ′ ) K L_{\text {backword }}(P’ \| Q’)K L backword (P ′∥Q ′) 作为 K L forward ( P ∥ Q ) K L_{\text {forward }}(P \| Q)K L forward (P ∥Q ) 和 K L backword ( P ∥ Q ) K L_{\text {backword }}(P \| Q)K L backword (P ∥Q ) 的替代，这样正向KL和反向KL就都变得可以计算了。

5、KL散度 Python 实现

def kld_softmax(x, y):
    px = get_dis(x)
    py = get_dis(y)

    softmax_x = softmax(px)
    softmax_y = softmax(py)

    KL = 0.0
    for i in range(len(softmax_x)):
        KL += softmax_x[i] * np.log(softmax_x[i] / softmax_y[i])
    return KL

def kld_smooth(x, y):
    px = get_dis(x)
    py = get_dis(y)

    px -= 0.001/3
    py -= 0.001/3

    KL = 0.0
    for i in range(len(px)):
        KL += px[i] * np.log(px[i] / px[i])
    return KL

def softmax(x,t=1):

    row_max = x.max()

    row_max=row_max.reshape(-1, 1)
    x = x - row_max

    x_exp = np.exp(x/t)
    x_sum = np.sum(x_exp, keepdims=True)
    s = x_exp / x_sum
    return s

6、References

[1]. Pattern Recognition and Machine Learning.

[2]. KL Divergence for Machine Learning.

[3]. Intuitive Guide to Understanding KL Divergence.

[4]. KL Divergence: Forward vs Reverse.

[5]. KL-divergence.pdf.

[6]. Variational Inference,.

[7]. GAP: Differentially Private Graph Neural Networks with Aggregation Perturbation

Original: https://blog.csdn.net/weixin_47160526/article/details/124008870
Author: 码猿小菜鸡
Title: KL散度详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624147/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch模型(.pt)转onnx模型(.onnx)的方法详解(1)

1. pytorch模型转换到onnx模型 2.运行onnx模型 3.比对onnx模型和pytorch模型的输出结果我这里重点是第一点和第二点，第三部分比较容易首先你要安装 …

人工智能 2023年7月25日
00253
Tensorflow 2.6.0 安装（环境：Anaconda；CPU版本；windows11）

目录一、安装 CPU 版本步骤如下：二、验证是否安装完成：参考官网：https://www.tensorflow.org/ 一、安装 CPU 版本步骤如下： 1…

人工智能 2023年5月25日
00191
解决pytorch检测不到cuda的问题/pytorch找不到GPU

检测代码： import torch device = torch.device("cuda" if torch.cuda.is_available() els…

人工智能 2023年7月20日
0068
图数据库neo4j使用

零、预备备：启动数据库本机数据库版本 Neo4j 3.5.13以管理员身份运行控制台（win+A+X），在命令窗口切入到主目录%NEO4J_HOME%\bin执行neo4j.ba…

人工智能 2023年6月1日
0096
Jena基于OWL的默认推理查询

目录一些背景数据导入普通查询推理查询一些背景通过Jena的API，我们可以将RDF的.nt文件导入到对应TDB存储中，然后使用相关API进行三元组的查询，但是这时候的查…

人工智能 2023年6月10日
00105
Matlab：格式化文本

Matlab：格式化文本格式化操作符的字段 * 转换字符子类型精度字段宽度标志值标识符特殊字符设置字段宽度和精度 * 在格式设定符外部指定字段宽度和精度使用标识符…

人工智能 2023年6月28日
0083
哈威放大器_EV22K5-12/24_现货

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
0084
Self-Attention：初步理解

Self-Attention 的基本结构与计算 Attention（注意力）实际上就是权重的另一种应用的称呼，其具体结构与初始输入的 content (\vec{x_{1}}, \…

人工智能 2023年6月4日
0063
Windows10搭建Tensorflow2 gpu环境(2021.11.15)

1.Anaconda创建tensorflow gpu环境 conda create -n tf2-gpu1 python=3.7 2.查看NVIDIA驱动版本右键->NVI…

人工智能 2023年5月25日
0067
花2个月面过华为测开岗，拿个30K不过分吧？

背景介绍 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is sto…

人工智能 2023年6月2日
00103
目标跟踪之Pysot系列代码训练（SiamRPNSiamRPN++）

代码地址：https://github.com/STVIR/pysot环境配置参考博客：Siam系列跟踪算法工具包PySOT配置一、数据集准备 Pysot系列跟踪器训练的时候，首…

人工智能 2023年5月26日
00131
利用聚类技术实现纹理图像分割

要求针对合成纹理图像中每一个像素提取纹理特征向量利用聚类技术（推荐用 k-均值聚类）对特征向量空间中的点进行聚类，类别数可根据图像中的实际纹理类数确定。最后把类属标签映射成…

人工智能 2023年5月31日
0074
YOLOv5输入端（一）—— Mosaic数据增强|CSDN创作打卡

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。一、原理分析二、代码分析 1、主体部分——load_mosaic 2、l…

人工智能 2023年6月24日
0071
彩色空间转换

目录前言 RGB彩色空间 NTSC彩色空间 YCbCr彩色空间 HSV彩色空间 CMY(K)彩色空间 HSI彩色空间代码实现（MATLAB）：前言人类获取信息很大一部分是依…

人工智能 2023年6月22日
0081
进化计算（四）——NSGA/NSGA II算法详解

NSGA/NSGA II算法理论学习 —A fast and elitist multiobjective genetic algorithm NSGA-II阅读笔记引言 * 概…

人工智能 2023年6月19日
00117
智源社区AI周刊No.109：ChatGPT预示大模型取代搜索引擎；Stable Diffusion2.1发布，8k高清图像生成…

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KL散度详解

KL散度详解

1、KL散度的概念

; 2、两类KL散度拟合效果的定性分析

; 3、两类KL散度拟合效果的数学推导

4、KL散度的计算

5、KL散度 Python 实现

6、References

大家都在看