第3章 隨機變量的數字特徵
[TOC]
隨機變量的數字特徵,是某些由隨機變量的分佈所決定的常數,它刻畫了隨機變量(或者說,刻畫了其分佈)的某一方面的性質。
3.1 數學期望(均值)與中位數
3.1.1 數學期望的定義
設隨機變量X只能取有限個可能值
a1,a2,⋯,am ,其概率分佈爲P(X=ai)=pi(i=1,⋯,m) 。則X的數學期望,記爲E(X)或EX,定義爲:
E(X)=a1p1+a2p2+⋯+ampm=∑aipi.
數學期望也常被稱爲均值。
當X取無窮多個值時,∑aipi 的上界取無窮,這時候要求這個級數是收斂的。這就要求:
∑i=0∞|ai|pi<∞ 對於連續型隨機變量的情況,設X是一個連續型隨機變量,如果:
∫∞−∞|x|f(x)dx<∞
則X的數學期望爲:
E(X)=∫∞−∞xf(x)dx
數學期望是由隨機變量的分佈完全決定的。
3.1.2 數學期望的性質
若干個隨機變量和的期望等於各變量的期望之和,即:
E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn).
若干個獨立隨機變量之積的期望等於各變量的期望之積,即:
E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn).
注意這裏要求各個隨機變量是相互獨立的。
設隨機變量X爲離散型,有分佈函數
P(X=ai)=pi(i=1,2,⋯) ;或者爲連續型,有概率密度函數f(x) 。則:
E(g(x))=∑ig(ai)pi(當∑i|g(ai)|pi)<∞時)
或
E(g(X))=∫∞−∞g(x)f(x)dx(當∫∞−∞|g(x)|f(x)dx<∞時)
也就是說,要求g(x)的期望,並不一定非要求出來g(x)的密度函數。
E(cX)=cE(X)
3.1.3 條件數學期望(條件均值)
按定義,條件數學期望:
E(Y|x)=∫∞−∞yf(y|x)dy
它反應了隨着x的取值變化,Y的變化情況是如何。這通常是研究者所關心的主要內容。比如人羣中固定身高x,平均體重的變化情況。在統計學上,也把E(Y|x)作爲x的函數,稱爲Y對X的“迴歸函數”。
聯想到全概率公式,有:
即一個變量的期望等於其條件期望的期望。
3.1.4 中位數
設連續型隨機變量X的分佈函數爲F(x),則滿足條件:
P(X<m)=F(m)=1/2
的m,稱爲X或分佈F的中位數。
與期望相比,中位數受個別特大值或特小值的影響很小。但是,應用卻沒有期望廣泛,主要是因爲:
- 期望(均值)有很多優良的性質。
- 中位數本身固有某些缺點,比如可以不唯一。
- 對於離散型的變量,可能並沒有理想的“中位”數。
3.2 方差與矩
設X爲隨機變量,分佈爲F,則:
Var(X)=E[(X−E(X))2]
稱爲X或分佈F的方差,其平方根Var−−−√ 稱爲X或分佈F的標準差。
Var(X)=E(X2)−[E(X)]2
- 常數的方差爲0。
- 若c爲常數,則
Var(X+c)=Var(X) 。 - 若c爲常數,則
Var(cX)=c2Var(X) 。
獨立隨機變量之和的方差等於各變量的方差之和。
Var(X1+⋯+Xn)=Var(X1)+⋯+Var(Xn)
設X爲一隨機變量,
E(X)=a ,而Var(X)=σ2 。記Y=(X−a)/σ ,則E(Y)=0,Var(Y)=1 。這樣對X進行一次線性變換後,得到一個具有均值爲0、方差爲1的變量Y。常稱Y是X的“標準化”。
正態分佈完全由均值和方差決定。方差
分佈 | 期望(均值) | 方差 |
---|---|---|
泊松分佈 | ||
指數分佈 | ||
二項分佈 | ||
負二項分佈 | ||
均勻分佈 | ||
正態分佈 | ||
n卡方分佈 | ||
n t分佈 | ||
(m,n) t分佈 |
3.2.2 矩
設X爲隨機變量,c爲常數,k爲正整數。則量
E[(X−c)k] 稱爲X關於c點的k階矩。
比較重要的有兩種情況:
c=0,αk=E(Xk) 稱爲X的k階原點矩。c=E(X),μk=E[(X−E(X))k] 稱爲X的k階原點矩。
3.3 協方差與相關係數
記
稱
E[(X−m1)(Y−m2)] 爲X,Y的協方差,並記爲Cov(X,Y) 。
Cov(c1X+c2,c3Y+c4)=c1c3Cov(X,Y)
Cov(X,Y)=E(X,Y)−m1m2
兩條性質:
1.若X,Y獨立,則
2.
稱
Cov(X,Y)/(σ1σ2) 爲X,Y的相關係數,並記爲Corr(X,Y) 。
形式上,可以把相關係數看成是“標準尺度下的協方差”。
兩條性質:
1.若X,Y獨立,則
2.
可以將相關係數看成是X與Y之間線性關係程度的度量。
3.4 大數定理和中心極限定理
3.4.1 大數定理
設
X1,X2,⋯,Xn,⋯ 是獨立同分布的隨機變量,均值和方差分別爲a,σ2 。則對任意給定的ε>0 ,有:
limn→∞P(|X¯−a|≥ε)=0
大數定理也可以理解成是當n很大時,我們有很大的把握斷言均值很接近a。
在概率論中,叫做
馬爾科夫不等式:
P(Y≥ε)≤E(Y)/ε
契比雪夫不等式:
P(|Y−EY|≥ε)≤Var(Y)/ε2
3.4.2 中心極限定理
也叫作林德伯格定理或林德伯格-萊維定理。
設
X1,X2,⋯,Xn,⋯ 是獨立同分布的隨機變量(注意並沒有說是什麼分佈),均值和方差分別爲a,σ2 。則對任何實數x,有:
,其中limn→∞P(1n√σ(X1+X2+⋯+Xn−na)≤x)=Φ(x) Φ(x) 是標準正態分佈N(0,1) 的分佈函數。
這其實是一個標準化的過程。這告訴我們,在很難求出
若
棣莫佛-拉普拉斯定理(最早的中心極限定理)
limn→∞P(1np(1−p)−−−−−−−−√σ(X1+X2+⋯+Xn−np)≤x)=Φ(x)
如果
其中
可以修正爲: