統計學:離散型和連續型隨機變量的概率分佈

主要隨機變量一覽表

隨機變量 概率分佈 均值 方差
一般離散型變量 p(x) xxp(x) x(xμ)2p(x)
二項分佈 p(x)=Cxnpxqnx (x=0,1,2,3,n) np npq
泊松分佈 p(x)=λxeλx! (x=0,1,2,) λ λ
超幾何分佈 p(x)=CxrCnxNrCnN nrN r(Nr)n(Nn)N2(N1)
均勻分佈 f(x=1ba (axb) a+b2 ba12
正態分佈 f(x)=1σ2πe(1/2)[(xμ)σ]2 μ σ2
標準正太分佈 f(z)=12πe(1/2)z2 0 1
指數分佈 f(x)=1θex/θ(x>0) μ=θ σ=θ

1. 離散型和連續型隨機變量的定義

離散型隨機變量(discrete random variable):取值是可數的個值的隨機變量, 比如投擲一枚骰子的朝上的點數,可能是1,2,3,4,5,6;比如南京大學四食堂吃飯的人數,可能是0,1,2···。
連續型隨機變量(continuous random variable):取值是一個區間中的任意一點(也就是不可數)的隨機變量,比如南京大學同學身高。


2. 離散型隨機變量的概率分佈

  1. 基本概念的公式表達
    均值(期望值expected value):μ=E(x)=xp(x)
    方差(variance):σ=E[(xμ)2]=(xμ)2p(x)
    標準差(standard deviation):σ=σ2
    其中,可以證明到E[(xμ2)]=E(x)2μ2
    2. 二項分佈
    如果進行n次不同的實驗,每次試驗完全相同並且只有兩種可能的結果,這樣的實驗結果分佈情況就是二項分佈。最簡單的比如投擲一枚硬幣,不管進行多少次實驗,實驗結果都只有正面朝上或者反面朝上,這就是一個簡單的二項分佈。
    二項概率分佈:

    p(x)=Cxnpxqnx (x=0,1,2,3,n)
    其中:n代表n次實驗,x表示實驗結果爲T的次數,q是實驗結果爲T的概率,q=1-p,表示實驗結果爲F的概率。
    

    二項分佈的
    均值:μ=np
    方差:σ2=npq
    標準差:σ=npq
    二項分佈對於結果只有兩種情況的隨機事件有非常好的描述,屬於日常生活中最常見、最簡單的隨機變量概率分佈,在知道某種實驗結果概率的情況下,能夠很好推斷實驗次數後發生其中某一結果次數的概率。
    3. 泊松分佈
    泊松分佈的概率分佈,均值和方差:

    p(x)=λxeλx! (x=0,1,2,)

    μ=λ

    σ2=λ

    4. 超幾何分佈
    超結合分佈和二項分佈比較相似,二項分佈每次實驗完全一樣,而超幾何分佈前一次的實驗結果會影響後面的實驗結果。簡單地講,二項分佈抽取之後放回元素,而超幾何分佈是無放回的抽取。
    超幾何分佈的概率分佈,均值和方差:
    p(x)=CxrCnxNrCnN

    μ=nrN

    σ2=r(Nr)n(Nn)N2(N1)

3. 連續型隨機變量的概率分佈

  • 概率密度函數(probability density function):
    又稱之爲頻率函數(frequency function),或者概率分佈(probability distribution),用來表示連續型隨機變量的概率分佈情況,一般是一條光滑的曲線。
    1. 正太分佈(normal distribution)
    正態分佈
    正態分佈是統計學中常見的一種分佈,表現爲兩邊對稱,是一種鍾型的概率分佈(bell curve),正太分佈有一下的特徵:


    概率密度函數:

    f(x)=1σ2πe(1/2)[(xμ)σ]2

    其中,μ 是正太隨機變量的均值;
    σ 是標準差;
    π 是圓周率,約等於3.1416···
    e=2.71828

特別的,當μ=0σ=1 的正態分佈,被稱爲標準正太分佈(standard distribution),此時有:

f(z)=12πe(1/2)z2

標準正態分佈有對應的標準正態分佈表,通過該表可以找到對應值累積的概率。

正太分佈轉化爲標準正態分佈:
正太分佈x,μσzz=xμ)/σ

正態分佈來近似二項分佈
當n足夠大的時候,正態分佈對於離散型二項分佈能夠很好地近似。
二項分佈

評價正態分佈
如何來確定數據是否正態分佈,主要有以下幾種方法:
1. 圖形感受法:建立直方圖或者枝幹圖,看圖像的形狀是否類似正太曲線,既土墩形或者鐘形,並且兩端對稱。
2. 計算區間x¯±s,x¯±2s,x¯±3s ,看落在區間的百分比是否近似於68%,95%,100%。(切比雪夫法則和經驗法則)
3. IQRsIQR/sIQR/s1.3.
4. 建立正態概率圖,如果近似正態分佈,點會落在一條直線上。
正態概率圖

2. 均勻分佈
均勻概率分佈(uniform probability distribution)是指連續隨機變量所有可能出現值出現概率都相同。
均勻分佈
均勻隨機變量x概率分佈特徵:
概率密度函數:

f(x=1ba (axb)

均值:μ=a+b2
標準差:σ=ba12

3. 指數分佈
指數概率分佈(exponential probability distribution),具有如下特徵:
概率密度函數:

f(x)=1θex/θ(x>0)

均值: μ=θ
標準差:σ=θ

更多文章:
概率論中基本概念回顧

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章