- 鏈接 概率論與數理統計BV15t411D7G1.
- 鏈接 知乎大佬筆記.
概率論的基本概念
- 隨機試驗
- 樣本空間、隨機事件
- 頻率與概率
- 等可能概型
- 條件概率
- 全概率公式與貝葉斯公式
- 事件獨立性
什麼是概率統計?
- 必然現象的確定性規律
隨機現象雖然存在不確定性,但還是存在一定規律的 (即 統計規律)
自測標準:
- 是否對 隨機 有足夠認識
是否對 數據 有興趣、有感覺
自然界現象:確定現象,隨機現象
試驗,不同於實驗 範圍比較廣
隨機試驗,用 E 表示
- 性質:1.可重複,2.可觀察 (結果不止一個,且知道S),3.不確定
我們通過隨機試驗來研究隨機現象
樣本空間,用 S 表示
E 的所有可能結果組成的集合
- S 中的元素是樣本點,每次試驗只有一個樣本點
隨機事件,S 的子集,通常用 A、B、C 表示
- 事件發生: A 中的一個樣本點出現,事件 A 發生
必然事件,就是 S
不可能事件,就是空集 Φ
基本事件,其集合中只包含了一個樣本點
事件的關係與運算
- 包含、相等
和事件,至少有一個發生,或、∪、+
積事件,同時發生,且、∩、× - 互斥、逆、差
互斥事件,A、B不同時發生,沒有交集(不相容)
對於不相容的事件,P(A+B) = P(A) + P(B)
互逆事件,A與A非
差事件,A發生B不發生,A - B - 獨立與互斥不同,若AB相互獨立,P(AB) = P(A) × P(B)
A - B = (A + B) - B = A - AB
因爲事件本身就是一個集合,所以滿足集合的所有運算定律
頻率,通過實驗結果來說明事件發生的頻繁程度
特徵:隨着實驗次數n增加,頻率會具有穩定性,即 fn(A)趨於一個穩定值 p
概率,刻畫隨機事件在一次試驗中發生可能性大小的數,即 p (概率的統計性定義)
P(A),A 事件發生的概率
概率的公理化定義:
- 非負性 P(A) >= 0
- 規範性 P(S) = 1
- 可列可加性 若A1 A2 …兩兩互斥,則P(A1+ A2 …) = P(A1)+P(A2)+…
可推出 P(B - A) = P(B) - P(AB) 性質4
加法公式:奇數個求和,偶數個求差
- P(A U B) = P(A) + P(B) - P(AB) 20.2.17
若A、B 不相容,則P(A U B) = P(A) + P(B)
所以計算 A 和 B 至少一個發生的概率需要先知道二者之間的關係
等可能概型 (古典概型) 基本的概率模型
特徵:
- 樣本空間中樣本點是有限的 (有限性 )
- 出現每一個樣本點的概率相等 (等可能性)
古典概型中主要就是數數了,怎麼把數給數對?
排列組合
組合數,Combination 排列數,Arrangement
鏈接:關於排列組合.
計算:共 m 項,從 n 開始遞減,計算組合數C時除 m! 即可
抽樣方法說明:
1.不放回抽樣 2.放回抽樣
不考慮順序的話,用組合數 隱藏
條件概率
- P(B | A) 表示在A發生的前提下,B發生的概率
樣本空間由 S 縮小爲 A
定義:P(B|A) = P(AB) / P(A) 其中P(A)大於0
乘法公式:P(AB) = P(B|A) × P(A)
事件ABC…同時發生的概率 = P(A) × P(B|A) × P(C|AB)… 20.2.24
若A、B相互獨立,則P(AB) = P(A) × P(B) - 抽籤問題
一般地,袋中有 a 只白球,b 只紅球,k 個人依次在袋中取 1 球,
則不論放回還是不放回,第 i 個人取到白球的概率爲 a / (a + b)
全概率公式 (全概型)
- 用全概率公式時,關鍵是 構造一個合適的劃分
定義 B1 ~ Bn 互不相交,且並集爲 S;稱爲 S 的一個劃分 (完備事件組)
定理 P(A) = P(B1)P(A|B1) + … + P(Bn)P(A|Bn)
注:全概率公式是概率論的一個基本公式.
直接計算 P(A) 不易時,可構造一個劃分 B1 … Bn,利用這個公式來計算P(A).
Bayes公式 (貝葉斯概型)
- 在 A 已經發生的情況下,求 Bi 發生的概率 (後驗概率)
執果索因
其中 利用全概率公式求得P(A) 做公式分母
獨立性
- 若 P(AB) = P(A)P(B) ,則 A 與 B 相互獨立
A事件發生與否 對 B事件發生的概率 完全無影響 例如:下雨
相互獨立與互不相容完全不同 20.3.9
A、B、C 兩兩獨立無法推出 A、B、C 相互獨立 - 實際問題中,常根據實際情形判斷事件獨立性
一旦判斷事件獨立,計算概率時儘可能用事件的乘積
小概率事件
- 實際推斷原理,概率很小的事件在一次試驗中幾乎是不可能發生的
小概率事件在大量獨立重複試驗中 至少發生一次 幾乎是必然的 - 千萬不能輕視小概率事件
隨機變量及其分佈
- 隨機變量
- 離散型隨機變量及其分佈律
- 隨機變量的分佈函數
- 連續型隨機變量及其概率密度
- 均勻分佈,指數分佈,正態分佈
- 隨機變量的函數的分佈
隨機變量,將隨機試驗的結果數量化
- 名爲變量,實際上是一種函數
X(e): S → R 的映射
自變量 e 具有隨機性,線上的一個點
用某一變量取得各種不同的數值來描述隨機試驗的結果(更方便表達)
簡寫爲 X、Y、Z - 分兩類:離散型 和 連續型
離散型隨機變量
- X 的取值有限個或可數個,則 X 爲離散型隨機變量
- 可數集 (可列集):其中的元素是可以被數到的,只要肯花時間
不可數集:[0, 1]
離散型隨機變量的概率分佈律
- 簡稱分佈律,又稱概率分佈,常用表格表示
內容包括:隨機變量的所有可能取值 + 每個取值對應的概率
另一種表示形式:P(X = xk) = pk
幾何分佈
P(X = k) = (0.8)k-1 • 0.2,k = 1,2,3…
常見的離散型隨機變量:
- 最簡單的 退化分佈 P(X = c) = 1
- 0-1分佈 (兩點分佈),
X ~ B(1, p)
只有兩個可能結果的試驗,貝努利試驗 (Bernoulli)
樣本空間只包含兩個元素
或僅考慮事件 A 發生與否
n重貝努利試驗中 A 發生的次數 X
P(X = k) = Cnk pk(1 - p)n-k
此時稱 X 服從 參數爲 n, p 的二項分佈,X ~ B(n, p)
- 泊松分佈 (Poisson)
若概率分佈已知,則隨機變量對應的樣本空間的任一隨機事件概率可求出
離散型隨機變量的分佈函數是階梯函數,跳躍點處的跳躍度就是該點概率
二項分佈,將兩種可能結果的試驗 獨立重複 n 次
概率分佈函數,F(x) = P(X ≤ x)
,線上的一段區域,X 落入(-∞, x]
的概率
單調不減,值域 (0 ~ 1) (右連續函數)
可以定義任何隨機變量
連續型隨機變量,一定有一個概率密度函數 f(t)
-
此函數非負,單點取值概率爲0,區間開閉無影響,
f(t)
值可以大於1
當其鄰域 △x 足夠小時,f(x)
與 △x 的乘積表示落在 x 點左右的概率 -
概率分佈律,連續的隨機變量有概率密度函數
泊松定理,泊松分佈表,X ~ π(λ)
,參數爲 λ 的泊松分佈
- 描述某段時間內,事件具體發生的概率
實際工作中,λ >= 20 即可用正態分佈來處理
其中 t = 時間,n = 數量,λ = 事件發生的頻率
均勻分佈,X ~ U(a, b)
,其概率密度函數 f(t)
值恆等於 區間長度分之一,其餘值爲0
- 可簡單理解爲:均勻分佈具有等可能性
計算概率時,可以用有效(範圍內)區間長度 / 區間長度 簡單計算 - 其分佈函數F(x),落入a之前的概率
P(x<a)
= 0,落入ab之間的概率爲 x - a / b - a,落入b之後的概率爲1
指數分佈,X ~ E(λ)
,無記憶性,f(x) = λe-λx
正態分佈,X ~ N(μ, σ)
,又叫高斯分佈、誤差分佈,高斯在研究誤差的時候發現了正態分佈
- σ 大於 0,關於 μ 對稱,對稱軸 μ 稱爲位置參數
- σ 稱爲尺度參數,σ越小,越瘦長 (分散程度)
- 多個隨機變量的和遵循正態分佈 (中心極限定理)
- f(x) 的積分是積不出來的,轉化爲標準正態,然後用標準正態分佈表來求
標準正態分佈,Z ~ N(0, 1)
鏈接 泊松分佈&指數分佈.
多維隨機變量及其分佈
- 二維隨機變量,離散型隨機變量分佈律
- 邊緣分佈
- 條件分佈
- 離散型隨機變量邊際分佈律與條件分佈律
- 二元隨機變量分佈函數,邊際分佈函數與條件分佈函數
- 二元連續型隨機變量,聯合概率密度
- 邊際概率密度
- 條件概率密度
- 二元均勻分佈,二元正態分佈(期末不考)
- 相互獨立的隨機變量
- 兩個隨機變量的函數的分佈
- Z = X + Y的分佈
- max(X, Y)、min(X, Y)的分佈
二元隨機變量,二維隨機變量
- 由線上的點轉換成了平面上的點
- 離散型,有限對或可列無窮對
聯合概率分佈律,表格,Pij
- X、Y 所有可能的取值,列出的表格
- 離散型分佈函數的跳躍點處的跳躍值 可直接得出 邊際分佈律
- 對於該表格,若X、Y相互獨立,則對應點的概率等於邊際分佈律之積
邊際分佈律 P(X = xi),Pi•
- 當 X 確定爲 xi 時對應的 所有的 Y 的概率之和
- 僅由邊際分佈律一般不能得到聯合分佈律
條件分佈律,Y = yj,條件已知,能寫出很多
- 例:求 P(X = xi | Y = yj),即 Pij / P·j,確定點的概率 / 條件滿足的所有概率之和
聯合分佈函數,F(x, y) = P(X ≤ x, Y ≤ y)
,座標系中點(x, y)
的左下平面,X,Y 落入該區域的概率
- 關於 x,y 單調不減,右連續
比一元多的性質:x1 x2 y1 y2 圍成的矩形區域,概率就是2,2減去1,2和2,1,加上重複減去的1,1
邊際分佈函數,令 x 趨於+∞,得 Y 的邊際函數 FY(y),即 F(+∞, y)
- 聯合概率分佈在平面直角座標系中比較好想
- X、Y 其一趨於 ∞ 時,就是將對應的邊延伸至無窮大,僅此而已
條件分佈函數,前提 y 點概率 > 0,否則無意義 (這又是一個極小的鄰域)
- 對於離散型的,y 點概率大於零即可,根據聯合分佈律寫出條件分佈律,再寫出條件分佈函數
- 對於連續型的,Y 在 y 極小鄰域範圍,仍記作 Y = y
聯合概率密度(函數),f(x, y)
,以 xoy 平面爲底的體積爲 1 的頂曲面
- 其二重積分爲聯合分佈函數,值即概率
- 同樣的極小鄰域 △x,△y,
f(x, y)
與 △x△y 的乘積表示落在(x, y)
點左右的概率 - 對於連續點
(x, y)
,F(x, y)
的二階偏導 =f(x, y)
邊際概率密度(函數),求 FY(y),對 x 在(-∞, +∞)
上積分
條件概率密度,指定的條件,聯合概率密度 / 邊際概率密度
二元均勻分佈,在面積爲 A 的區域 D 中,有 f(x, y)
= 1 / A,其餘爲 0
二元正態分佈,(X,Y) ~ N(μ1, μ2, σ12, σ22, ρ) 概率密度式子不好寫。。,鐘形圖 (這兩個不考)
- 二元正態分佈的兩個邊際分佈都是一元正態分佈,且都不依賴 ρ
- 條件分佈仍是正態分佈,依賴 ρ
隨機變量的獨立性
- 定義:若分佈函數 = 邊際函數之積,則 X、Y 相互獨立
- 離散型:Pij = Pi· P·j ,分佈律判斷,需檢驗所有等式,一對不等即可判斷不獨立
- 連續型:
f(x, y) = f(x)f(y)
,密度函數判斷,
若獨立,則可分解爲 x 的函數與 y 的函數的乘積(反之不成立)
隨機變量函數的分佈,對應一元的函數的分佈
隨機變量的數字特徵
- 數學期望
- 方差
- 協方差及相關係數
- 矩、協方差矩陣
數學期望,就是平均值
隨機變量的數學期望
- 離散型隨機變量 X,期望 E(X) = ∑ xk pk 累加和,前提 級數收斂
推的過程:1/n · ∑ xk·nk = ∑ xk·nk/n = ∑ xk·fk,fk 頻率 穩定值爲 pk
pk 也可理解爲加權平均中的權重 - 連續型隨機變量 X,期望 E(X) =
∫ xf(x)dx
在(-∞, +∞)
上積分 - 參數爲 λ 的泊松分佈的數學期望就是 λ
- 參數爲 μ σ 的正態分佈,數學期望爲 μ
- 參數爲 λ 的指數分佈,數學期望爲 1/λ
- 參數爲 n p 的二項分佈,數學期望爲 n·p
- 參數爲 p 的幾何分佈,數學期望爲 1/p
隨機變量函數的數學期望
- 計算 E(Y) 時,不必算出 Y 的分佈律或 f(Y),
只需利用 X 的分佈律或概率密度 以及 Y 和 X 之間的關係就可以了,同理推廣至二元
懶人定理 the Rule of the Lazy Statistacian
- 離散型,Y = g(X),E(Y) = E[ g(X) ]
- 連續型,E(Y) = E(g(X)) = ∫-∞+∞
g(x)f(x)dx
數學期望的性質
- E(aX + bY + c) = aE(X) + bE(Y) + c
- E(XY) = E(X) E(Y),X、Y相互獨立
方差
- 離差:X - E(X),平均離差 E[ X - E(X) ] = 0
- 方差:E{ [ X - E(X) ]2},記作 D(X) 或 Var(X)
計算方差,通常用法:D(X) = E(X2) - [E(X)]2 - 標準差、均方差:方差開根號,記作 σ(X),刻畫 X 取值的波動性,衡量 X 取值的分散程度
方差的性質
- 常數方差 = 0,反之方差爲 0,說明取值恆定爲 c,E(X) = c
- D(cX) = c2D(X)
- D(X + Y) = D(X) + D(Y) + 2·tail,
tail = E{[X-E(X)]·[Y-E(Y)]}
,當X、Y相互獨立時,tail = 0 - D(X + c) = D(X),等價於平移,波動性不變
常見
- 參數爲 n,p 的二項分佈
B(n, p)
,E(X) = np,D(X) = np(1-p) - 參數爲 μ σ 的正態分佈N(μ, σ2),E(X) = μ,D(X) = σ2
- n 個獨立正態隨機變量,線性組合仍服從正態分佈
協方差,是一個有量綱的數字特徵 (量綱就是單位)
- 就是上面的 tail,記作 Cov(X, Y)
tail ≠ 0 證明 X、Y 不相互獨立
tail > 0,稱 X 與 Y 正相關
tail < 0,負相關
tail = 0,不相關 - 將其乘開再化簡,得 tail = E(XY) - E(X)E(Y),即協方差計算公式
協方差性質
- 代入 tail 可得證
- XY可互換,無影響
- Y = X,tail = D(X)
- Cov(aX, bY) = ab·Cov(X, Y)
- Cov(X1 + X2, Y) = Cov(X1, Y) + Cov(X2, Y)
相關係數,爲消除量綱的影響 (表示線性關係密切程度)
- ρXY = Cov(X, Y) / √D(X)·D(Y)
- 性質:ρXY 屬於
(-1, 1)
|ρXY| = 1 時,當且僅當X、Y之間有嚴格的線性關係
不相關,本質意思就是 X、Y 無線性關係 (獨立:二者沒有關係)
- ρXY = 0,不相關,等價條件 tail = 0 以及 E(XY) = E(X)E(Y)
- 獨立則不相關,反之不然
矩陣暫時瞭解,記 n 元正態隨機變量的四條重要性質
- n 元正態隨機變量,是一個向量,其任意子向量均服從 k 元正態分佈
- 充要條件,其中元素 X1 X2 …任意線性組合均服從 1 元正態分佈
- 正態變量的線性變換不變性
- X1 X2 … 相互獨立
<=>
X1 X2 …兩兩不相關<=>
協方差矩陣爲對角矩陣 (唯對角線非0)
大數定律及中心極限定理
- 大數定律
- 中心極限定理
依概率收斂
- 對於 隨機變量序列 Y1 Y2 …,n 趨於正無窮時,P{ |Yn - c| ≧ ε } = 0
稱 隨機變量序列{Yn, n ≧ 1} 依概率收斂於 c
切比雪夫不等式 Chebyshev,適用範圍廣,結果比較粗糙
貝努裏大數定律:頻率依概率收斂於概率
告訴我們,可以通過大量的獨立重複實驗來確定事件的概率
大數定律 Laws of Large Numbers
- 隨機變量序列依概率收斂於 μ,當 E(Xi) 都相同時,μ = E(Xi)
切比雪夫大數定律的推論
- 前提:Xi相互獨立,期望都爲 μ,方差都爲 σ2
- 算術平均依概率收斂到 μ
辛欽大數定律
- 前提:Xi 獨立同分布
- 算術平均依概率收斂到 μ
獨立同分布的中心極限定理 CLT
德莫弗-拉普拉斯中心極限定理
解題步驟
- 先根據中心極限定理,將正態分佈寫出,然後套用公式得出答案.
樣本及抽樣分佈
- 隨機樣本
- 直方圖和箱線圖
- 抽樣分佈
定義
- 總體,全體
- 個體,全體中的一個
- 容量,總體中個體的數目
- 有限總體的容量足夠大時可看作無限總體
- 樣本,總體的子集,本書中皆指簡單隨機樣本
簡單隨機樣本的特點:獨立同分布
如何得到該樣本:放回抽樣 (無限總體用不放回) - 樣本觀測值,每次觀測樣本得到的樣本值不一樣
- 提取有效信息,構造統計量
- 常用統計量:樣本均值,樣本方差(
1/(n-1)
),樣本矩 - 注:樣本均值 x拔 ≠ 總體均值 μ
- 統計量的分佈叫做抽樣分佈
- 抽樣分佈有三個比較重要的:卡方分佈,t分佈,f分佈;(除正態分佈外)
上α分位點,即該點右側的概率爲α(面積爲α),該數值需查表
隨機變量大於這個數的概率 = α
卡方 χ2,多個服從 N(0,1) 的隨機變量的平方和
自由度,指隨機變量的個數
χ2 ~ χ2(n)
E(X) = n,D(X) = 2n
可加性:Y1+Y2 ~ χ2(n1+n2)
對一般的正態分佈X,標準化 Yi = (Xi - μ)/σ
χ2 = Yi2 的累加和
t分佈
T ~ t(n)
就是 T = X / (√Y/n) ,其中Y ~ χ2(n),X服從標準正態 N(0, 1)
即自由度爲 n 的 t 分佈
n趨於+∞時的 t 分佈,就是標準正態分佈
F分佈
F ~ F(n1, n2),自由度爲 n1,n2 的 F 分佈
1/F
~ F(n2, n1)
就是 F = (X/n1) / (Y/n2),其中X ~ χ2(n1),Y ~ χ2(n2)
上α分位點:F1-α(n1, n2) = 1 / Fα(n2, n1)
正態總體的樣本均值與樣本方差的分佈
X拔 ~ N(μ, σ2/n)
E(S2) = σ2
鏈接 t分佈, 卡方x分佈,F分佈.
參數估計
- 點估計
- 基於截尾樣本的極大似然估計
- 估計量的評選標準
- 區間估計
- 正態總體均值與方差的區間估計
- 0-1分佈參數的區間估計
- 單側置信區間
P72