最小二乘法法原理及推導
說明:本文是在學習最小二乘法時在博文中轉發的,將其轉發是爲了日後便於查看。更爲清晰的過程 詳見本文出處
[本文出處](https://blog.csdn.net/marsjohn/article/details/54911788
這裏的是爲了區分Y的實際值y(這裏的實際值就是統計數據的真實值,我們稱之爲觀察值),當x取值(i=1,2,3……n)時,Y的觀察值爲,近似值爲(或者說對應的縱座標是)。
其中式叫做Y對x的迴歸直線方程,b叫做迴歸係數。要想確定迴歸直線方程,我們只需確定a與迴歸係數b即可。
設x,Y的一組觀察值爲:
i = 1,2,3……n
其迴歸直線方程爲:
當x取值(i=1,2,3……n)時,Y的觀察值爲,差刻畫了實際觀察值與迴歸直線上相應點縱座標之間的偏離程度,見下圖:
實際上我們希望這n個離差構成的總離差越小越好,只有如此才能使直線最貼近已知點。換句話說,我們求迴歸直線方程的過程其實就是求離差最小值的過程。
一個很自然的想法是把各個離差加起來作爲總離差。可是,由於離差有正有負,直接相加會互相抵消,如此就無法反映這些數據的貼近程度,即這個總離差不能用n個離差之和來表示,見下圖:
一般做法是我們用離差的平方和,即:
作爲總離差 ,並使之達到最小。這樣迴歸直線就是所有直線中Q取最小值的那一條。由於平方又叫二乘方,所以這種使“離差平方和爲最小”的方法,叫做最小二乘法。
用最小二乘法求迴歸直線方程中的a、b的公式如下:
其中,、爲和的均值,a、b的上方加“︿”表示是由觀察值按最小二乘法求得的估計值,a、b求出後,迴歸直線方程也就建立起來了。
當然,我們肯定不能滿足於直接得到公式,我們只有理解這個公式怎麼來的才能記住它,用好它,因此給出上面兩個公式的推導過程更加重要。在給出上述公式的推導過程之前,我們先給出推導過程中用到的兩個關鍵變形公式的推導過程。首先是第一個公式:
基本變形公式準備完畢,我們可以開始最小二乘法求迴歸直線方程公式的推導了:
至此,公式變形部分結束,從最終式子我們可以看到後兩項
與a、b無關,屬於常數項,我們只需
即可得到最小的Q值,因此:
至此,公式推導完畢。