統計學：離散型和連續型隨機變量的概率分佈

原創

2020-02-24 02:30

主要隨機變量一覽表

隨機變量	概率分佈	均值	方差
一般離散型變量	p(x)的表、公式或者圖	∑xxp(x)	∑x(x−μ)2p(x)
二項分佈	p(x)=Cxnpxqn−x (x=0,1,2,3⋅⋅⋅,n)	np	npq
泊松分佈	p(x)=λxe−λx! (x=0,1,2,⋅⋅⋅)	λ	λ
超幾何分佈	p(x)=CxrCn−xN−rCnN	nrN	r(N−r)n(N−n)N2(N−1)
均勻分佈	f(x）=1b−a (a≤x≤b)	a+b2	b−a12√
正態分佈	f(x)=1σ2π√e−(1/2)[(x−μ)σ]2	μ	σ2
標準正太分佈	f(z)=12π√e−(1/2)z2	0	1
指數分佈	f(x)=1θe−x/θ(x>0)	μ=θ	σ=θ

1. 離散型和連續型隨機變量的定義

離散型隨機變量（discrete random variable）：取值是可數的個值的隨機變量，比如投擲一枚骰子的朝上的點數，可能是1,2,3,4,5,6；比如南京大學四食堂吃飯的人數，可能是0,1,2···。
連續型隨機變量（continuous random variable）：取值是一個區間中的任意一點（也就是不可數）的隨機變量，比如南京大學同學身高。

2. 離散型隨機變量的概率分佈

基本概念的公式表達
均值（期望值expected value）：μ=E(x)=∑xp(x)
方差（variance）：σ=E[(x−μ)2]=∑(x−μ)2p(x)
標準差（standard deviation):σ=σ2−−√
其中，可以證明到E[(x−μ2)]=E(x)2−μ2
2. 二項分佈
如果進行n次不同的實驗，每次試驗完全相同並且只有兩種可能的結果，這樣的實驗結果分佈情況就是二項分佈。最簡單的比如投擲一枚硬幣，不管進行多少次實驗，實驗結果都只有正面朝上或者反面朝上，這就是一個簡單的二項分佈。
二項概率分佈：

p(x)=Cxnpxqn−x (x=0,1,2,3⋅⋅⋅,n)
```
其中：n代表n次實驗，x表示實驗結果爲T的次數，q是實驗結果爲T的概率，q=1-p，表示實驗結果爲F的概率。
```
二項分佈的
均值：μ=np
方差：σ2=npq
標準差:σ=npq−−−√
二項分佈對於結果只有兩種情況的隨機事件有非常好的描述，屬於日常生活中最常見、最簡單的隨機變量概率分佈，在知道某種實驗結果概率的情況下，能夠很好推斷實驗次數後發生其中某一結果次數的概率。
3. 泊松分佈
泊松分佈的概率分佈，均值和方差：

p(x)=λxe−λx! (x=0,1,2,⋅⋅⋅)

μ=λ

σ2=λ

4. 超幾何分佈
超結合分佈和二項分佈比較相似，二項分佈每次實驗完全一樣，而超幾何分佈前一次的實驗結果會影響後面的實驗結果。簡單地講，二項分佈抽取之後放回元素，而超幾何分佈是無放回的抽取。
超幾何分佈的概率分佈，均值和方差：

p(x)=CxrCn−xN−rCnN

μ=nrN

σ2=r(N−r)n(N−n)N2(N−1)

3. 連續型隨機變量的概率分佈

概率密度函數（probability density function）：
又稱之爲頻率函數（frequency function），或者概率分佈（probability distribution），用來表示連續型隨機變量的概率分佈情況，一般是一條光滑的曲線。
1. 正太分佈（normal distribution）

正態分佈是統計學中常見的一種分佈，表現爲兩邊對稱，是一種鍾型的概率分佈（bell curve）,正太分佈有一下的特徵：

概率密度函數：
$f (x) = 1 σ 2 π - - \sqrt e - (1 / 2) [(x - μ) σ] 2$
其中，μ 是正太隨機變量的均值；
σ 是標準差；
π 是圓周率，約等於3.1416···
e=2.71828⋅⋅⋅

特別的，當μ=0且σ=1 的正態分佈，被稱爲標準正太分佈（standard distribution），此時有：

f (z) = 1 2 π - - \sqrt e - (1 / 2) z 2

標準正態分佈有對應的標準正態分佈表，通過該表可以找到對應值累積的概率。

正太分佈轉化爲標準正態分佈：
正太分佈x,均值是μ，標準差是σ，z定義爲z=（x−μ)/σ

正態分佈來近似二項分佈
當n足夠大的時候，正態分佈對於離散型二項分佈能夠很好地近似。

評價正態分佈
如何來確定數據是否正態分佈，主要有以下幾種方法：
1. 圖形感受法：建立直方圖或者枝幹圖，看圖像的形狀是否類似正太曲線，既土墩形或者鐘形，並且兩端對稱。
2. 計算區間x¯±s,x¯±2s,x¯±3s ，看落在區間的百分比是否近似於68%，95%，100%。（切比雪夫法則和經驗法則）
3. 求IQR和標準差s，計算IQR/s，如若是正態分布，則IQR/s≈1.3.
4. 建立正態概率圖，如果近似正態分佈，點會落在一條直線上。

2. 均勻分佈
均勻概率分佈（uniform probability distribution）是指連續隨機變量所有可能出現值出現概率都相同。

均勻隨機變量x概率分佈特徵：
概率密度函數：

f (x ） = 1 b - a (a \leq x \leq b)

均值：

μ=a+b2
標準差：

σ=b−a12√

3. 指數分佈
指數概率分佈（exponential probability distribution），具有如下特徵：
概率密度函數：

f (x) = 1 θ e - x / θ (x > 0)

均值：

μ=θ
標準差：

σ=θ

更多文章：
概率論中基本概念回顧

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

統計學：離散型和連續型隨機變量的概率分佈

主要隨機變量一覽表

1. 離散型和連續型隨機變量的定義

2. 離散型隨機變量的概率分佈

3. 連續型隨機變量的概率分佈

敏捷UX開發與UCD

用戶需求和產品需求的採集、分析、篩選和管理

產品開發中項目與項目管理

統計學：離散型和連續型隨機變量的概率分佈

樣本統計量與總體的關係，抽樣分佈的概念性質

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結