如何學好概率論與數理統計

   《概率論與數理統計》這門課啊,我說很好學,大家一定不會同意。我發現,許多甚至是專業的同學,都說概率不好學,統計更是摸不到邊。以我看,是你沒有掌握竅門。

我向來不喜歡講“竅門”的,今天也要講一點了。這門課,實際上一半是高等數學,一半是概率模型。這句話的意思是,高等數學學紮實了,概率統計就學好了一半。而概率模型呢?簡單地說,就是將該概率的問題抽象出來,用高等數學建立概率的數學模型。

之所以學不好概率統計,大抵有兩個原因:一是高等數學本身就學的不紮實,二是對數學模型的建立缺乏感受,理解困難:因爲概率研究的對象是“不確定”的事件的統計規律,與我們以前所學的數學研究的確定的事件不同,方法也有異。

大家學高等數學啊,有一個明顯的弊病:就是不求甚解。舉一個例子,比如用元素法(微元法)建立積分,這是積分的應用,也是它最有意思,最關鍵的部分。可是考試不要求啊,難度大啊,同學們就不重視了,分數至上嘛,這不知害死多少人。大家想想,元素法不正是積分的關鍵嗎?定積分不定積分的那些方法,實際運用中大都是很機械的,用多了,誰都能掌握,我不是說它們不重要,但是,假如在應用中,你連積分式都列不出,還奢談什麼呢?

扯遠了,回到概率。概率呢?實際上正是高數的一個典型應用!好傢伙,到這個時候,大家又依賴套公式,將數學中最有意思的分析拋到腦後,這樣學,一輩子也休想學好數學,只能越學越費勁。就好比搭積木,前面搭不平,勉強還可以搭幾層,到後面就徹底垮了!

概率是怎麼樣和高數聯繫起來的呢?它先是根據實際情形建立一個公理化的概率的概念,大家要注意:針對實際應用的概念與純理論的概念有所不同,它必須考慮到它和實際情形的吻合。從這個公理化概念,我們用集合中和元素給出樣本空間,樣本點等概念,然後用數學中的變量給出隨機變量的概念,也就是將事件對應隨機變量的一個取值範圍,“隨機變量”與以前數學的“變量”關鍵的不同在於,隨機變量的取值是隨機的,它每一個範圍對應一個概率值。好,我們繼而用函數給出隨機變量的分佈情況,就是給出隨機變量對應的概率的整體的描述,我們只要得到了它,就可以求出隨機變量在任意區間的概率值。大家說這是不是一個數學模型啊?針對離散型與連續型隨機變量,我們給出不同的函數形式,離散型的函數我們稱分佈律或概率函數,針對連續型我們給出初等函數,總之都是函數的形式。

有了函數,求概率的事情就可以藉助高數中函數的許多工具了。看,概率的分佈函數F(x),是變量取值小於x的概率值,這樣,是不是給出了概率和函數的對應?對函數概念理解深刻的人,可以欣賞到它的妙處:只要告訴我取值的區間,我就可以精確算出此區間的概率值。我們還可以將高數中的微積分引入概率:連續型的隨機變量的概率密度反映了隨機變量分佈在個區間的密集程度,它和分佈函數是這樣的關係:分佈函數的導數是概率密度,概率密度的定積分是分佈函數!我們說導數是函數的變化率,用在這裏就是分佈函數的變化的快慢反映了隨機變量在此處的分佈的密集程度;我們說定積分的幾何意義是函數對應的曲邊梯形的面積,應用在這裏就是將概率密度在某區間對應的曲邊梯形的面積算出來就是再次區間的概率值!多麼完美的微積分模型!這就是我說概率的一半是高數的原因。

有了這個模型,我們可以將高數的微積分的成果都搬過來。比如單調性、凹凸性、漸近線都可以用來描述概率密度函數;兩個隨機變量的分佈情況我們可以藉助多元函數的微積分;高數中的收斂可以在這裏推廣爲依概率收斂;求隨機變量函數的分佈可以用變上限積分的求導……。高數中的許多概念再這裏都賦予新的意義,大家要深刻領會,做概率題將不再難!

關於統計學部分。數理統計與概率論的關係是:概率是統計的基礎,統計是概率的直接應用。爲什麼統計要用到概率呢?因爲統計不僅僅是將數據記錄下來,我們還要根據統計的數據分析事物的性質。而我們統計的數據,往往不可能窮舉,因此只是整體事物的一部分。我們要根據一部分的統計數據窺見整體的風貌,這一部分的取值是隨機的,這就和概率聯繫上了。概率和統計最關鍵的樞紐就是大數定律,我原來做學生的時候沒有十分的理解其重要性,其實,沒有大數定律,概率論的整個大廈就崩潰了!大數定律講的是當樣本量達到足夠大時,其均值依概率收斂於一個定值,正是這個定值,保證了我們前面概率論中隊事件賦以一個概率值的意義所在,不然這樣的賦值無法求出,概率的實際意義也就消失了!在這裏我們更好地理解了概率是一個統計規律。統計規律嘛,就是我們不能看一時一事,而是要考慮大量的隨機事件反映出來的一種整體規律!正是因爲這一點,我們站在不同的時間點上,概率會發生質的變化,因此有了“先驗”和“後驗”的區別,沒有什麼奇怪的。

接着統計學講到總體、樣本、樣本值的概念,對於概念,同學們還是不屑於理解,依我看你吃虧很大。只要你理解了三大概念的本質,我看統計就變成概率了!因爲我們是用概率解決統計問題的嘛!只要你知道,總體是抽象整體、樣本是隨機的局部、樣本值時樣本取的具體值(如同隨機變量取的值一樣),這裏體現了一種辯證的關係:普遍性寓於特殊性之中。正因爲這個辯證關係,我們每一個簡單樣本的個體可以看成獨立同分布的隨機變量,同什麼分佈呢?就是同總體的分步嘛!因爲普遍性寓於特殊性之中!我們從特殊的樣本作爲多個獨立同分布隨機變量,可以構造不同的函數(統計量),其分佈就是抽樣分佈了!就可以開始研究各種統計規律了。有了這樣的提綱契領,統計是不是就學好了一半?

 基於上面的總則,我們將統計分成兩部分:一是參數估計,一是假設檢驗。(實際上統計學遠不止這些,這只是基礎的常用的知識)參數估計講的是知道總體分佈,但是不知道其中的某些參數,因此需要抽樣估計它,我們講要構造適當的統計量,這個統計量估計的好不好,不是一兩次碰巧可以算數的,靠的是其抽樣分佈的分析!這是科學啊,分析靠什麼呢?就是概率,我們通過概率,就不需要靠多少次實驗檢驗取得經驗了,而是靠概率算出來,這樣的計算最終和實驗是會契合的,因爲它是科學嘛!也正因爲是估計,難免有誤差,所以我們要給出一個衡量的方法,於是有了:置信度和置信區間。假設檢驗呢?就是先對參數進行假設,有原假設與備擇假設,它們是兩個互逆的假設。我們有點像做數學的反證法,我們呢先假設原假設成立,當實驗數據與原假設相差甚遠時,我們就認爲原假設不對,從而支持備擇假設。只要“證據不足”我們認爲“不顯著”,因此還是支持原假設。哈,說起來不難呢!但是實際操作上你必須拿數據說話啊!還是要用統計量的分佈來說明問題。具體我就不深談了。

以上是我多年的學習教學的體會,對初學者一定會有幫助的!這些話可以作爲一個總原則,當學的具體時,你拿來好好體會一下,知識就容易貫通,貫通了,解一般的題目不在話下。有的同學覺得好難理解哦!當然啦,我也是經過教書3-5年後才領會其精髓的啊!沒關係,慢慢來,學習就是水滴石穿!

                                        

                                                   忠傑

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章