相對熵 KL散度（KullbackLeibler divergence）

原創

超级无敌小小顺利

2020-06-16 04:05

這個屬於香農信息論中的東西，在《PRML》書中1.6 信息論小節中有具體說明。真正碰到應用還是在洛桑聯邦理工的POM文章中（概率佔用圖）。作者使用自己產生的估計Q來去逼近未知分佈P，其中P是一個後驗概率分佈。這篇博文旨在明確KL散度的定義以及用途，以備後用。

香農大神：

KL散度是兩個概率分佈間差異的非對稱性度量，是一些優化算法（例如最大期望算法EM）的損失函數，參與計算的一個概率分佈是真實分佈，另一個是擬合分佈。相對熵表示使用理論分佈擬合真實分佈時產生的信息損耗。

設有未知分佈，使用估計概率分佈逼近未知分佈，則KL散度定義爲：

$KL(p||q)=-\int{p(x)lnq(x)}dx-\left ( -\int{p(x)lnp(x)dx} \right )$

$KL(p||q)=-\int{p(x)ln\left (\frac{q(x)}{p(x)} \right )}dx$

離散情況下寫爲：

$KL(P||Q)=\sum P(x)log\frac{P(x)}{Q(x)}$

1. 不對稱性：KL散度的兩個概率分佈不可以隨意調換位置，是有向的。

2. 並且 $KL(p||q)\geqslant 0$ ，只有在時才取等號。

放一個離散型KL散度的運算實例：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

最小二乘法、最大似然估計和卡爾曼濾波

一、最小二乘法和最大似然估計最小二乘法可以從Cost/Loss function角度去想，這是統計（機器）學習裏面一個重要概念，一般建立模型就是讓loss function最小，而最小二乘法可以認爲是 loss function = （

2020-06-23 11:56:07

類別不均衡問題

問題背景機器學習建模分類問題裏，各個類別樣本量差異較大時，就會出現類別不均衡問題。e.g.如果有99999個無症狀病例，1個有症狀病例，即使訓練的學習器將所有樣本識別成無症狀病例，準確率也高達99.9%；但是這樣的學習器沒有任何

2020-06-21 21:23:46

機器學習算法相關list

感知機perceptron k近鄰法k-nearest neighbor 樸素貝葉斯法naive Bayes 決策樹decision tree 決策樹缺失值處理方法邏輯斯諦迴歸與最大熵模型logistic regression/

2020-06-21 21:23:46

深度學習算法相關list

前饋神經網絡，BP算法 NN/BP 卷積神經網絡(Convolutional Neural Network, CNN) 循環神經網絡(Recurrent Neural Network, RNN)與LSTM RNN/LSTM 深度前

2020-06-21 21:23:46

洛桑聯邦理工 TPAMI-2008 MTMC 概率佔用圖POM建模過程推導筆記

一切都要從2019年9月的那個秋天講起，林野哥向我推薦了這篇洛桑聯邦理工的2008年TPAMI論文，於是一個半月的時間都花在了這上面。Multi-Camera People Tracking with a Probabilistic O

超级无敌小小顺利

2020-06-16 04:05:31

《最優化理論與算法》最優化條件部分學習感悟

最優化學到了最優化條件部分，由於自己的數學功底實在是太差，啃得很慢。今天下午終於對“約束極值問題的最優性條件”部分有了相對宏觀的視角，所以記錄下來以備後用。【必要條件】：如果已經知道了是最優解，那麼它一定滿足的條件。最優化中通常都

超级无敌小小顺利

2020-06-16 04:05:31

Kalman Filter原理簡介及C++實現

本博文內容參考了北卡羅來納大學教堂山分校的文章 An Introduction to the Kalman Filter。目錄一、Kalman Filter簡介二、估計與觀測過程三、KF的計算起源（Computational O

超级无敌小小顺利

2020-06-16 04:05:31

手動實現讀寫鎖(線程級)

讀寫鎖是共享獨佔鎖。讀鎖是共享鎖：讀的同時不能寫，但同時可以多個進程一起讀。寫鎖是獨佔鎖：同時只能有一個進程進行寫。利用庫函數寫模式： pthread_rwlock_wrlock(&rwlock); //加寫鎖寫

2020-06-06 13:53:15

移動最小二乘原理

钢铁侠是怎么练成的

2020-05-22 20:56:46

PFH和FPFH的算法原理

钢铁侠是怎么练成的

2020-05-22 20:56:46

密碼學硬核筆記——特殊離散對數問題

丶坚持不懈

2020-05-15 14:58:23

軌跡規劃 - 梯形速度分佈

2020-05-07 14:14:32

助你穩過高校離散結構 --（系列一）

2020-05-06 06:48:09

粒子濾波器的Matlab實現

2020-05-04 09:29:35

概率圖模型-知識結構

兩週多，終於把概率圖模型這一章看完了，由於只是看了知識框架，很多具體細節都還不理解。內容真的是好多啊，而且都是理論，沒有實踐。希望日後用到的時候能回憶的起來這些內容吧。

超级无敌小小顺利

2020-06-16 04:05:31

24小時熱門文章

最新文章

最新評論文章