經典摘錄-貝葉斯公式

本博客已遷移至 SnailDove’s Blog, 查看本文，請點擊此處

說明：全文摘自 Introduction to probability, 2nd Edition

本文討論條件概率定律的應用，首先引入一個計算事件概率的定理。

全概率公式

設 $A_{1}, A_{2}, . . ., A_{n}$ 是一組互不相容的事件，它形成樣本空間的一個分割（每個試驗結果必定使得其中一個事件發生！）。又假定對每個 $i, P (A_{i}) > 0$ 。則對任何事件 $B$ ，下列公式成立

\begin{array}{rcl} P (B) & = & P (A_{1} \cap B) + \dots + P (A_{n} \cap B) \\ = & P (A_{1}) P (B | A_{1}) + \dots + P (B) P (B | A_{n}) \end{array}

下圖是全概率公式的圖示和證明。直觀上，將樣本空間分割成若干事件

A_{i}

的並（

A_{1}, \dots, A_{n}

形成樣本空間的一個分割）然後任意事件

B

的概率等於事件

B

在

A_{i}

發生的情況下的條件概率的加權平均，而權重剛好等於這些事件

A_{i}

的無條件概率。這條定理的一個主要應用是計算事件

B

的概率。直接計算事件

B

的概率有點難度，但是若條件概率

P (B | A_{i})

是已知的或是很容易推導計算時，全概率定理就成爲了計算

P (B)

的有力工具。應用這條定理的關鍵是找到合適的分割

A_{1}, \dots, A_{n}

，而合適的分割又與問題的實際背景有關。

由於事件 $A_{1}, A_{2}, \dots, A_{n}$ 形成一個樣本空間的一個分割，事件 $B$ 可以分解成不想交的 $n$ 個事件的並，即：

B = (A_{!} \cap B) \cup \dots \cup (A_{n} \cap B) (1)

利用可加定理，得到：

P (B) = P (A_{1} \cap B) + \dots + P (A_{n} \cap B) (2)

利用條件概率的定義，得到：

P (A_{i} \cap B) = P (A_{i}) P (B | A_{i}) (3)

將

(3)

式子代入

(2)

式子中得到：

P (B) = P (A_{1}) P (B | A_{1}) + \dots + P (A_{n}) P (B | A_{n})

也可以用等價的序列樹形圖來說明全概率定理（如上右邊圖）：葉子

A_{i} \cap B

的概率等於由葉子到根部上的概率的乘積

P (A_{i}) P (B | A_{i})

。而事件

B

由圖上顯示的3個葉子組成，將它們的概率相加就得到

P (B)

。

全概率公式例子

例 1.13 你參加一個棋類比賽，其中 $50 %$ 是一類棋手，你贏他們的概率爲 $0.3 %$ ； $25 %$ 是二類棋手，你贏他們的概率是 $0.4$ ；剩下的是三類棋手，你贏得他們的概率是 $0.5$ 。從他們中間隨機地選一位棋手與你比賽，你勝算的概率有多大？

記 $A_{i}$ 表示與你下棋的棋手的類別。依題意

P (A_{1}) = 0.5, P (A_{2}) = 0.25, P (A_{3}) = 0.25

記

B

爲你贏得比賽的事件，那麼得到：

P (B | A_{1}) = 0.3, P (B | A_{2}) = 0.4, P (B | A_{3}) = 0.5

那麼利用全概率公式，你在不比賽中勝出的概率爲：

\begin{array}{rcl} P (B) & = & P (A_{1}) P (B | A_{1}) + P (A_{2}) P (B | A_{2}) + P (A_{3}) P (B | A_{3}) \\ = & 0.5 \cdot 0.3 + 0.25 \cdot 0.4 + 0.25 \cdot 0.5 \\ = & 0.375 \end{array}

推斷與貝葉斯定理

全概率公式經常與著名的貝葉斯公式聯繫起來，貝葉斯公式將形如 $P (A | B)$ 的條件概率與形如 $P (B | A)$ 的條件概率聯繫起來。

貝葉斯公式

設 $A_{1}, A_{2}, \dots, A_{n}$ 是一組互斥的事件，它形成樣本空間的一個分割（每個試驗結果必定使得其中一個事件發生）。又假定對每一個 $i, P (A_{i}) > 0$ ，則對於任何事件 $B$ ，只要它滿足 $P (B) > 0$ ，下列公式成立：

\begin{array}{rcl} P (A_{i} | B) & = & \frac{P (A_{i}) P (B | A_{i})}{P (B)} \\ = & \frac{P (A_{i}) P (B | A_{i})}{P (A_{1}) P (B | A_{1}) + \dots + P (A_{n}) P (B | A_{n})} \end{array}

爲證明貝葉斯公式，只需注意到

P (A_{i}) P (B | A_{i})

與

P (B) P (A_{i} | B)

是相等的，它們都等於

P (A_{i} \cap B)

，這樣得到了第一個等式，至於第二個等式，只需對

P (B)

利用全概率公式即可。

貝葉斯公式還可以用來進行因果推理。有許多”原因“可以造成某一”結果“。現在設我們觀察到某一結果，希望推斷造成這個結果出現的”原因“。現在設事件 $A_{1}, \dots, A_{n}$ 是原因，而 $B$ 代表由原因引起的結果。 $P (B | A_{i})$ 表示在因果模型中由”原因“ $A_{i}$ 造成結果 $B$ 的概率（見下圖）。當觀察到結果 $B$ 的時候，希望反推結果 $B$ 是由原因 $A_{i}$ 造成的概率 $P (A_{i} | B)$ 。 $P (A_{i} | B)$ 爲由於代表新近得到的信息 $B$ 之後 $A_{i}$ 出現的概率，稱之爲後驗概率，而原來的 $P (A_{i})$ 就稱爲先驗概率。

貝葉斯推斷的例子

醫學

在某病人X光片中發現一個陰影，（用 $B$ 表示，代表”結果“）。希望對造成這種結果的3個原因進行分析。這3個原因互斥，並且造成這個結果的原因一定是三者之一：原因1（事件 $A_{1}$ ）是惡性腫瘤，原因2（事件 $A_{2}$ ）是良性腫瘤，原因3（事件 $A_{3}$ ）是腫瘤外的其他原因。假定已經知道 $P (A_{i})$ 和 $P (B | A_{i}), i = 1, 2, 3$ 。現在已經發現了陰影（事件 $B$ 發生），利用貝葉斯公式，這些原因的條件概率爲：

P (A_{i} | B) = \frac{P (A_{i}) P (B | A_{i})}{P (A_{1}) P (B | A_{1}) + P (A_{2}) P (B | A_{2}) + P (A_{3}) P (B | A_{3})}, i = 1, 2, 3

在右圖給出序列樹形圖，可用序列樹形圖給出條件概率計算的另外一種等價的解釋。圖中第一個深灰的葉子表示惡性腫瘤並出現陰影，其概率爲

P (A_{1} \cap B)

，且所有深灰的葉子表示片子中出現陰影，其概率爲

P (B)

，而由惡性腫瘤造成陰影的條件概率

P (A_{1} | B)

是兩個概率相除的結果。

比賽

繼續使用例 1.13 你參加一個棋類比賽，其中 $50 %$ 是一類棋手，你贏他們的概率爲 $0.3 %$ ； $25 %$ 是二類棋手，你贏他們的概率是 $0.4$ ；剩下的是三類棋手，你贏得他們的概率是 $0.5$ 。現在假定你已經得勝，問你的對手爲一類棋手的概率有多大？
用 $A_{i}$ 表示你與 $i$ 類棋手相遇的事件。由例中給出的條件知道：

P (A_{1}) = 0.5, P (A_{2}) = 0.25, P (A_{3}) = 0.25

記

B

表示你贏的比賽的事件，你勝出的概率爲：

P (B | A_{1}) = 0.3, P (B | A_{2}) = 0.4, P (B | A_{3}) = 0.5

利用貝葉斯公式得：

\begin{array}{rcl} P (A_{1} | B) & = & \frac{P (A_{1}) P (B | A_{1})}{P (A_{1}) P (B | A_{1}) + P (A_{2}) P (B | A_{2}) + P (A_{3}) P (B | A_{3})} \\ = & \frac{0.5 \cdot 0.3}{0.5 \cdot 0.3 + 0.25 \cdot 0.4 + 0.25 \cdot 0.5} \\ = & 0.4 \end{array}

假陽性之謎

設對於某種少見的疾病的檢出率爲 $0.95$ ；如果一個被檢查的病人有某種疾病，其檢查結果爲陽性的概率爲 $0.95$ ；如果該人沒有這種疾病，其檢查結果爲陰性的概率是 $0.95$ 。現在假定某一人羣中患有這種病的概率爲 $0.001$ ，並從這個總體中隨機地抽取一個人進行檢測，檢查結果爲陽性。現在問這個人患有這種病的概率有多大？

設 $A$ 爲這個人有這種疾病， $B$ 爲經檢驗這個人爲陽性。利用貝葉斯公式：

\begin{array}{rcl} P (A | B) & = & \frac{P (A) P (B | A)}{P (A) P (B | A) + P (A^{c}) P (B | A^{c})} \\ = & \frac{0.001 \cdot 0.95}{0.001 \cdot 0.95 + 0.999 \cdot 0.05} \\ = & 0.0187 \end{array}

儘管檢驗方法非常精確，一個經檢測爲陽性的人仍然不大可能真正患有這種疾病（患有該疾病的概率小於

2 % ​

）。根據《經濟學人》雜誌

1999 ​

年

2 ​

月

20 ​

日的報道，在一家著名的大醫院中

80 % ​

的受訪者不知道這類問題的正確答案，而大部分人回答，這個經檢測爲陽性的人患病概率爲

0.95 ​

連續隨機變量的貝葉斯公式

在許多情況下，我們會遇到一個沒有觀察到的對象。用隨機變量 $X$ 代表這種未觀察到的量，設其概率密度函數是 $f_{X} (x)$ 。我們能夠觀察到的量是經過噪聲干擾的量 $Y$ ， $Y$ 的分佈函數是條件分佈函數，其條件概率密度函數爲： $f_{X | Y} (y | x)$ 。當 $Y$ 的值被觀察到以後，它包含 $X$ 的多少信息呢？這類問題與離散隨機變量的推斷問題類似。現在唯一的不同之處在於處理的是連續隨機變量。

上圖是推斷問題的框圖，有一個未觀察到的變量 $X$ ，其概率密度函數 $f_{X}$ 是已知的，同時得到一個觀察到的隨機變量 $Y$ ，其條件概率密度函數爲 $f_{Y | X} (y | x)$ 。給定 $Y$ 的觀察值 $y$ ，推斷問題變成條件概率密度函數 $f_{X | Y} (x | y)$ 的計算問題。

注意到：當觀察到事件 $Y = y$ 以後，所有的信息都包含在條件概率密度函數 $f_{X | Y} (x | y)$ 中，現在只需計算這個條件概率密度函數。利用公式 $f_{X} f_{Y | X} = f_{X, Y} = f_{Y} f_{X | Y}$ 可以得到：

f_{X | Y} (x | y) = \frac{f_{X} (x) f_{Y | X} (y | x)}{f_{Y} (y)}

這個即所求的公式，與之等價的公式：

f_{X | Y} (x | y) = \frac{f_{X} (x) f_{Y | X} (y | x)}{\int_{- \infty}^{+ \infty} f_{X} (t) f_{Y | X} (y | t) d t}

例子

通用照明公司生產一種燈泡，已知其使用壽命 $Y$ 爲指數隨機變量，其概率密度函數爲 $λ e^{- λ y}, y > 0$ ，按過往經驗，在任意給定的一天參數實際上是一個隨機變量，其概率密度函數爲區間上的均勻分佈。現在隨機地取已知燈泡進行試驗，得到燈泡的壽命數據。得到數據以後，對於的分佈有什麼新的認識？

將看成一個隨機變量，作爲對的初始認識，那麼根據題意的概率密度函數是：

當得到數據

以後，關於

的信息包含於條件概率密度函數

中，利用連續貝葉斯公式得到：

關於連續隨機變量的推斷

在許多實際問題中，未觀察到的隨機變量可能是連續的隨機變量。例如，在通信問題中傳輸的信號是一個二進制的信號，經過傳輸以後，混入的噪聲是正態隨機變量，這樣，觀測到的隨機變量就是連續的隨機變量；或者在醫療診斷中，觀察到的量也是連續的測量值，例如：體溫或血液樣本中的指標。這種情況下需要將貝葉斯公式作適當改變。

現在研究一種特殊情況，未觀察到的是一個事件。不知道是否發生了。事件的概率是已知的。設是一個連續的隨機變量，並且假定條件概率密度函數和是已知的。令人興趣的是事件的條件概率密度函數。這個量代表得到的觀察值以後關於事件的信息。

由於事件是一個零概率事件，轉而去考慮事件，其中是一個很小的正數，然後令趨於0 。利用貝葉斯公式，令，我們得到：

利用全概率公式，可將上式的分母寫成：

這樣得到：

現在令事件

具有形式

，其中

是一個離散的隨機變量，代表未觀察到的隨機變量。記

爲

的分佈函數。令

爲連續隨機變量，對任意

的取值

，

具有條件概率密度函數

。這樣上面的公式變成：

利用下面的全概率公式：

得到：

例子-信號檢測

設是一個只取2個值的信號（signal）。記和。在接收端，得到的信號爲，其中是一個正態分佈的噪聲（noise），期望爲0，方差爲1，並且與相互獨立。當觀察到的信號爲的時候，的概率是多少？

對於給定的是一個正態隨機變量，期望爲，方差爲。應用剛纔得到的公式：

將上式化簡得：

注意：當

，當

。

在實數軸上變化時，

是

的嚴格上升函數，這符合直觀的理解。

基於離散觀察值的推斷

在前文連續隨機變量的貝葉斯公式中得到的：

反解得到：

根據歸一性（

），那麼得到一個等價的表達式：

這個公式可以用於當事件

被觀測到時候，對隨機變量

進行推斷。對於事件

是

的形式，根據前文：

得到一個相似的公式對隨機變量

進行推斷：

總結

令爲連續隨機變量。

若爲連續隨機變量，則有：

和
若爲離散隨機變量，則有：

得到貝葉斯公式爲：

和
對於事件，關於和具有類似的貝葉斯公式。

經典摘錄-貝葉斯公式

全概率公式

全概率公式例子

推斷與貝葉斯定理

貝葉斯公式

貝葉斯推斷的例子

醫學

比賽

假陽性之謎

連續隨機變量的貝葉斯公式

例子

關於連續隨機變量的推斷

例子-信號檢測

基於離散觀察值的推斷

總結

coursera機器學習公開課筆記2: linear-regression-with-one-variable

coursera機器學習公開課筆記4: linear-regression-with-multiple-variables

經典摘錄-貝葉斯公式

coursera機器學習公開課筆記1：Introduction

清華大學公開課《線性代數2》總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結