貝葉斯公式

你真的理解貝葉斯公式嗎?

轉載自 https://www.jianshu.com/p/d9757860c4f8

大家經常看到的貝葉斯公式(Bayes)是寫成如下圖的形式,通常以P(A|B),P(B|A)的形式表示,雖然數學上看着簡單,那到底A,B是什麼意思,應該怎麼去理解呢,然後怎麼運用於實際情況呢?

 

貝葉斯(Bayes)公式是解決由觀察到的現象(或是測量的數據)去推斷現象(或是數據)後面的規律(或是假設)的發生的概率的問題。那麼如果將上面公式中的A換成“規律”,B換成“現象”,這個公式就一目瞭然,能很容易理解和運用了。

對於一個場景,可能有幾種不同的規律來解釋,根據對場景的一些現象的觀測,怎麼知道各種可能的規律在背後發生作用的概率,這就是想回答的問題P(規律|現象)。直接去計算有難度,但是我們知道在某個規律下,不同現象發生的概率P(現象|規律),和每個現象發生的概率P(規律),和不同現象發生的概率P(現象)。貝葉斯就是告訴怎麼用這些知道的知識去計算現象後面的規律發生的概率(具體推導請參考條件概率和文氏族圖)。所以,最重要的是分清(理解)場景或是問題中的規律和現象!

看幾個例子。

第一個例子。兩個一模一樣的碗,一號碗有30顆水果糖和10顆巧克力糖,二號碗有水果糖和巧克力糖各20顆。現在隨機選擇一個碗,從中摸出一顆糖,發現是水果糖。請問這顆水果糖來自一號碗的概率有多大?

分清和定義現象和規律。這兒有兩個規律:從一號碗來規律,從二號碗來規律。有兩種現象:水果糖現象,巧克力現象。而且知道兩個一模一樣的碗,所以兩個規律的概率一樣,P(從一號碗來規律)=P(從二號碗來規律)=0.5。同時知道P(水果糖現象|從一號碗來規律)=30/(30+10)=0.75,P(巧克力現象|從一號碗來規律)=10/(30+10)=0.25;P(水果糖現象|從二號碗來規律)=20/(20+20)=0.5,P(巧克力現象|從二號碗來規律)=20/(20+20)=0.5。另外,P(水果糖現象)=(30+20)/(30+10+20+20)=0.625,P(巧克力現象)=(10+20)/(30+10+20+20)=0.375。現在的問題是觀察到了一個水果糖現象,要求推斷後面的規律,即從一號碗來的規律的概率是多大,也就是P(從一號碗來規律|水果糖現象)。

好了,有了前面那些知識,根據貝葉斯公式,就可以計算問題的答案。

P(從一號碗來規律|水果糖現象)=P(水果糖現象|從一號碗來規律)P(從一號碗來規律)/P(水果糖現象)=0.750.5/0.625=0.6。

這樣,理解了問題中的現象和規律,是不是就很好理解了。

第二個例子。一所學校裏面有 60% 的男生,40% 的女生。男生總是穿長褲,女生則一半穿長褲一半穿裙子。假設你走在校園中,迎面走來一個穿長褲的學生(很不幸的是你高度近似,你只看得見他(她)穿的是否長褲,而無法確定他(她)的性別),你能夠推斷出他(她)是男生的概率是多大嗎?

同樣,分清和理解問題中的規律和現象。這兒有兩個規律:是男生規律,是女生規律。而且知道各個規律的發生概率P(是男生規律)=0.6,P(是女生規律)=0.4。有兩種現象:穿長褲現象,穿裙子現象。而且知道各個現象發生概率,假設有10個學生,6個男生,4個女生,那麼,P(穿長褲現象)=(6+2)/10=0.8,P(穿裙子現象)=2/10=0.2。另外,P(穿長褲現象|是男生規律)=1.0,P(穿裙子現象|是男生規律)=0.0,P(穿長褲現象|是女生規律)=0.5,P(穿裙子現象|是女生規律)=0.5。現在,看到了一個穿長褲的學生,需要推斷是男生的概率,即P(是男生規律|穿長褲現象)。

好了,有了前面那些知識,根據貝葉斯公式,就可以計算問題的答案。

P(是男生規律|穿長褲現象)=P(穿長褲現象|是男生規律)P(是男生規律)/P(穿長褲現象)=1.00.6/0.8=0.75。

再次看到,只要理解了問題中的規律和現象,運用貝葉斯公式是多麼自然和容易。

所以,理解和運用貝葉斯公式的關鍵是:理清問題中的規律和現象!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章