KL散度簡介

KL散度的概念來源於概率論和信息論中。KL散度又被稱爲：相對熵、互熵、鑑別信息、Kullback熵、Kullback-Leible散度(即KL散度的簡寫)。在機器學習、深度學習領域中，KL散度被廣泛運用於變分自編碼器中(Variational AutoEncoder,簡稱VAE)、EM算法、GAN網絡中。

KL散度定義

KL散度的定義是建立在熵(Entropy)的基礎上的。此處以離散隨機變量爲例，先給出熵的定義，再給定KL散度定義。

若一個離散隨機變量X的可能取值爲 $X={x_1,x_2,⋯,x_n}$ ，而對應的概率爲 $p_i=p(X=x_i)$ ，則隨機變量 $X$ 的熵定義爲：
$H(X)=−∑_i^n=p(x_i)log_p(x_i)$ 規定當 $p(x_i)=0時,p(x_i)log_p(x_i)=0$
若有兩個隨機變量 $P、Q$ ，且其概率分佈分別爲 $p(x)、q(x)$ ，則 $p$ 相對 $q$ 的相對熵爲：

$D_{KL}(p||q)=∑_i^np(x)log{p(x)\over q(x)}$
之所以稱之爲相對熵，是因爲其可以通過兩隨機變量的交叉熵(Cross-Entropy)以及信息熵推導得到：
針對上述離散變量的概率分佈 $p(x)、q(x)$ 而言，其交叉熵定義爲：
$H(p,q)=∑_xp(x)log{1\over q(x)}=−∑_xp(x)logq(x)$
在信息論中，交叉熵可認爲是對預測分佈 $q(x)$ 用真實分佈 $p(x)$ 來進行編碼時所需要的信息量大小。
因此，KL散度或相對熵可通過下式得出：

$D_{KL}(p||q)=H(p,q)−H(p)=−∑_xp(x)logq(x)−∑_x−p(x)logp(x)=-∑_xp(x)(logq(x)−logp(x))=−∑_xp(x)log{q(x)\over p(x)}$

代碼

import numpy as np
from scipy import *

def asymmetricKL(P,Q):
    return sum(P * log(P / Q)) #calculate the kl divergence between P and Q
 
def symmetricalKL(P,Q):
    return (asymmetricKL(P,Q)+asymmetricKL(Q,P))/2.00

KL = scipy.stats.entropy(P,Q)

服從一維高斯分佈的隨機變量KL散度

服從多元高斯分佈的隨機變量KL散度

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

KL Divergence

KL散度簡介

KL散度定義

代碼

服從一維高斯分佈的隨機變量KL散度

服從多元高斯分佈的隨機變量KL散度

安裝TensorFlow錯誤

TensorFlow編程入門

tensorflow_tutorials_04_perception on MNIST

tensorflow_tutorials_libs.activations

tensorflow_tutorials_libs.utils

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結