用計算機語言理解隨機變量和樣本的區別

在統計學領域有兩個核心的基本概念,其中一個是隨機變量,而第二個是樣本

如果不做深入思考的話,大可以百度看看這兩者之間到底是什麼聯繫.我想大家可能會知道個大概.

但是理解這個兩者的區別至關重要,對這兩者的區別,決定了你看論文以及後續學習統計學概念的一大

非常非常重要,而且是直接影響後續深入的一大門檻,而在自己工作的這些年,我對這兩者之間的聯繫再做

一個區分度更大的直觀解釋.

很多人開始接觸學習統計學的第一步都會設計到這兩個概念.但是這些概念在統計學或者數學的角度來說

至少對自己來說太過於抽象,我習慣性地想用現實中的客體來映射這兩種根本區別.

對與"隨機變量"來講:統計學這麼解釋,如果一個變量,其值由一個隨機試驗所決定的,那麼這個就是就是變量..

如果是對剛剛入門的人來講,這個講解太過於抽象,一般這樣的解釋跟沒解釋差不多(雖然這樣解釋可以說是學術上爲了避免概念之間打架做的規範,但是說真的,在中國大陸這樣的教育方式司空見慣..跑偏了).

打個比方,假設我要做人口普查,我現在要做的試驗對象

就是我們要調查的人,當然還需要調查人的一些屬性,比如身高,年齡作爲我們的需要的數據錄入數據庫系統.請問這個過程中

什麼纔是隨機變量?

那麼試問當你學了什麼是隨機變量以後,對與上面的這個問題,說者的無濟於事....

因爲,一個試驗所決定的東西還是比較多的,比如,普查對象的"人",我們在做調查的時候這個"人"是不是隨機的?那麼"人"

是不是隨機變量?還有,我們要取的值比如,我調查了一個"人",比"張三",他的身高:2m,體重,180公斤,年齡200歲,我說這個2m就是"隨機"變量,你說這個是不是?其實以上都不是隨機變量的概念.其實這個隨機變量就像計算機系統中存儲的變量是很像的.比如我們創造一個類如下(python)

class Person(Object):

       def __init__(self):

            self.name = "張三"

            self.age = 200

這裏我們要做調查的是"人"這個對象,但是他們的取值是變化的,比如這個人名字可以取"張三","李四","隔壁老王"...

那麼這個可以真正變動的就是 name 和 age這兩個值,也就是說,隨機變量就是 name 和age.因爲這兩個值是隨機變動的,而調查的對象"人",是由這一種屬性所代表的.因此,結合統計學意義來看,這裏person是由兩個隨機變量所決定,一個是名字(name),另一個是年齡(age).同樣的在人口調查中所描述的試驗中,其隨機變量就是 "年齡","身高","....",這些我們調查的"屬性"或者"特徵",就是我們所代表的"隨機變量".

那麼"樣本"又是什麼?估計大家通過以上的瞭解,你是否還會再想去百度或這統計書上看看,"樣本"的概念是啥吧.不過教課書上對樣本的描述在我認爲還是有點點抽象,以至於我以前初學的時候經常會與"隨機變量"搞混,其實樣本,就是我們做試驗的時候所要得到的課題的整體描述,比如上面的人口普查,我去取了個"張山"這個人作爲我調查的對象,而"張山"這個人就是"樣本",那麼通過這樣的解釋.

這個是我的隨想,以防止忘記了,有不足之處還望指點!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章