MATLAB-數據統計分析

一、統計量

 

  1. 表示位置的統計量—平均值和中位數.

   平均值(或均值,數學期望):

 中位數:將數據由小到大排序後位於中間位置的那個數值.

2. 表示變異程度的統計量—標準差、方差和極差.

   標準差

         它是各個數據與均值偏離程度的度量.

   方差:標準差的平方.

       極差:樣本中最大值與最小值之差.

對隨機變量x,計算其基本統計量的命令:

mean(x)均值
std(x)標準差
median(x)中位數
var(x)方差

下文轉載:https://www.cnblogs.com/leezx/p/7340045.html

離散型隨機變量分佈

1.兩點分佈/伯努利分佈

伯努利分佈是二項分佈在n=1時的特例。一次隨機試驗,成功概率爲p,失敗概率爲q=1-p。

伯努利分佈

2.二項分佈

1502348320(1)

二項分佈(Binomial distribution)是n重伯努利試驗成功次數的離散概率分佈。

二項分佈的典型例子是扔硬幣,硬幣正面朝上概率爲p, 重複扔n次硬幣,k次爲正面的概率即爲一個二項分佈概率。

二項分佈

3.超幾何分佈

對N件產品(其中M件次品)進行不放回抽樣,在n次抽樣種抽到次品數X,服從超幾何分佈。

超幾何分佈

4.幾何分佈

X記首次成功的概率,服從幾何分佈。

5.負二項分佈

X記第k次成功時總的實驗次數,當k=1時,爲幾何分佈。

“二項分佈”是固定試驗總次數N的獨立試驗中,成功次數k的分佈;而“負二項分佈”是所有到成功r次時即終止的獨立試驗中,失敗次數k的分佈。

image

負二項分佈

Negative binomial distribution

負二項迴歸模型的統計推斷

例子:

Pat is required to sell candy bars to raise money for the 6th grade field trip. There are thirty houses in the neighborhood, and Pat is not supposed to return home until five candy bars have been sold. So the child goes door to door, selling candy bars. At each house, there is a 0.4 probability of selling one candy bar and a 0.6 probability of selling nothing.

What's the probability of selling the last candy bar at the nth house?

6.泊松分佈

有些事件,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。

如:已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?

如:已知所有cell中reads的總數,相當於知道均值,問下一個細胞的reads數是多少。

這些從常理上看,我們會歸爲均勻分佈,但現實就是泊松分佈。

泊松分佈和指數分佈:10分鐘教程

如何理解泊松分佈和泊松過程

 

連續型隨機變量分佈

1.均勻分佈

 

2.指數分佈

指數分佈是事件的時間間隔的概率。

3.正態分佈

反應誤差的最重要的分佈,確定了均值和標準差就能確定一種正態分佈。

 

參考:

伯努利分佈、二項分佈、多項分佈、Beta分佈、Dirichlet分佈

負二項分佈爲什麼叫這個名字?“負”從何而來?

 

數字特徵

1.期望

相當於平均值

2.方差

就是方差

3.協方差

所以,我們可以定義一個表示X, Y 相互關係的數字特徵,也就是協方差

cov(X, Y) = E(X-EX)(Y-EY)。

當 cov(X, Y)>0時,表明 X與Y 正相關;

當 cov(X, Y)<0時,表明X與Y負相關;

當 cov(X, Y)=0時,表明X與Y不相關。

這就是協方差的意義。

終於明白協方差的意義了

4.相關係數

image

翻譯一下:就是用X、Y的協方差除以X的標準差和Y的標準差。

所以,相關係數也可以看成協方差:一種剔除了兩個變量量綱影響、標準化後的特殊協方差。

如何通俗易懂地解釋「協方差」與「相關係數」的概念?

5.矩

原點矩

中心矩

 

其他數字特徵

中位數

分位數

衆數

變異係數:將離散程度標準化,等於均值除以方差

偏態係數

峯態係數

 

大數定律

如果實驗次數足夠大,樣本均值就會趨近於總體的期望

好吧,學概率的時候,我們總有一種潛在的潛在的觀念   

——當數很大的時候平均值,就是期望值。   

比如,我們投骰子,如果我們投100次,求出現的數的平均,我們覺得會差不多是(1+6)/2=3.5 因爲我們按照期望計算,算出來就是3.5。   

但是,這是我們一個假定,我們還需要論證,爲什麼當數很大的時候,平均值就是期望值呢?  這就是大數定理證明了的了。   

中心極限定理

大量相互獨立的隨機變量,其均值(或者和)的分佈以正態分佈爲極限(意思就是當滿足某些條件的時候,比如Sample Size比較大,採樣次數區域無窮大的時候,就越接近正態分佈)。而這個定理amazing的地方在於,無論是什麼分佈的隨機變量,都滿足這個定理。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章