主要隨機變量一覽表
隨機變量 | 概率分佈 | 均值 | 方差 |
---|---|---|---|
一般離散型變量 | |||
二項分佈 | |||
泊松分佈 | |||
超幾何分佈 | |||
均勻分佈 | |||
正態分佈 | |||
標準正太分佈 | 0 | 1 | |
指數分佈 |
1. 離散型和連續型隨機變量的定義
離散型隨機變量(discrete random variable):取值是可數的個值的隨機變量, 比如投擲一枚骰子的朝上的點數,可能是1,2,3,4,5,6;比如南京大學四食堂吃飯的人數,可能是0,1,2···。
連續型隨機變量(continuous random variable):取值是一個區間中的任意一點(也就是不可數)的隨機變量,比如南京大學同學身高。
2. 離散型隨機變量的概率分佈
基本概念的公式表達
均值(期望值expected value):μ=E(x)=∑xp(x)
方差(variance):σ=E[(x−μ)2]=∑(x−μ)2p(x)
標準差(standard deviation):σ=σ2−−√
其中,可以證明到E[(x−μ2)]=E(x)2−μ2
2. 二項分佈
如果進行n次不同的實驗,每次試驗完全相同並且只有兩種可能的結果,這樣的實驗結果分佈情況就是二項分佈。最簡單的比如投擲一枚硬幣,不管進行多少次實驗,實驗結果都只有正面朝上或者反面朝上,這就是一個簡單的二項分佈。
二項概率分佈:
p(x)=Cxnpxqn−x (x=0,1,2,3⋅⋅⋅,n) 其中:n代表n次實驗,x表示實驗結果爲T的次數,q是實驗結果爲T的概率,q=1-p,表示實驗結果爲F的概率。
二項分佈的
均值:μ=np
方差:σ2=npq
標準差:σ=npq−−−√
二項分佈對於結果只有兩種情況的隨機事件有非常好的描述,屬於日常生活中最常見、最簡單的隨機變量概率分佈,在知道某種實驗結果概率的情況下,能夠很好推斷實驗次數後發生其中某一結果次數的概率。
3. 泊松分佈
泊松分佈的概率分佈,均值和方差:
p(x)=λxe−λx! (x=0,1,2,⋅⋅⋅)
μ=λ
σ2=λ
4. 超幾何分佈
超結合分佈和二項分佈比較相似,二項分佈每次實驗完全一樣,而超幾何分佈前一次的實驗結果會影響後面的實驗結果。簡單地講,二項分佈抽取之後放回元素,而超幾何分佈是無放回的抽取。
超幾何分佈的概率分佈,均值和方差:
p(x)=CxrCn−xN−rCnN
μ=nrN
σ2=r(N−r)n(N−n)N2(N−1)
3. 連續型隨機變量的概率分佈
概率密度函數(probability density function):
又稱之爲頻率函數(frequency function),或者概率分佈(probability distribution),用來表示連續型隨機變量的概率分佈情況,一般是一條光滑的曲線。
1. 正太分佈(normal distribution)
正態分佈是統計學中常見的一種分佈,表現爲兩邊對稱,是一種鍾型的概率分佈(bell curve),正太分佈有一下的特徵:
概率密度函數:f(x)=1σ2π−−√e−(1/2)[(x−μ)σ]2 其中,
μ 是正太隨機變量的均值;
σ 是標準差;
π 是圓周率,約等於3.1416···
e=2.71828⋅⋅⋅
特別的,當
標準正態分佈有對應的標準正態分佈表,通過該表可以找到對應值累積的概率。
正太分佈轉化爲標準正態分佈:
正太分佈
正態分佈來近似二項分佈
當n足夠大的時候,正態分佈對於離散型二項分佈能夠很好地近似。
評價正態分佈
如何來確定數據是否正態分佈,主要有以下幾種方法:
1. 圖形感受法:建立直方圖或者枝幹圖,看圖像的形狀是否類似正太曲線,既土墩形或者鐘形,並且兩端對稱。
2. 計算區間
3.
4. 建立正態概率圖,如果近似正態分佈,點會落在一條直線上。
2. 均勻分佈
均勻概率分佈(uniform probability distribution)是指連續隨機變量所有可能出現值出現概率都相同。
均勻隨機變量x概率分佈特徵:
概率密度函數:
均值:
標準差:
3. 指數分佈
指數概率分佈(exponential probability distribution),具有如下特徵:
概率密度函數:
均值:
標準差:
更多文章:
概率論中基本概念回顧