最小二乘法的原理及推導

原創

2018-10-02 07:56

最小二乘法法原理及推導

說明：本文是在學習最小二乘法時在博文中轉發的，將其轉發是爲了日後便於查看。更爲清晰的過程詳見本文出處
[本文出處](https://blog.csdn.net/marsjohn/article/details/54911788

在數據的統計分析中，數據之間即變量x與Y之間的相關性研究非常重要，通過在直角座標系中做散點圖的方式我們會發現很多統計數據近似一條直線，它們之間或者正相關或者負相關。雖然這些數據是離散的，不是連續的，我們無法得到一個確定的描述這種相關性的函數方程，但既然在直角座標系中數據分佈接近一條直線，那麼我們就可以通過畫直線的方式得到一個近似的描述這種關係的直線方程。當然，從前面的描述中不難看出，所有數據都分佈在一條直線附近，因此這樣的直線可以畫出很多條，而我們希望找出其中的一條，能夠最好地反映變量之間的關係。換言之，我們要找出一條直線，使這條直線“最貼近”已知的數據點，設此直線方程爲：

這裏的

是爲了區分Y的實際值y（這裏的實際值就是統計數據的真實值，我們稱之爲觀察值），當x取值

(i=1，2，3……n)時，Y的觀察值爲

，近似值爲

（或者說對應

的縱座標是

）。

其中

式叫做Y對x的迴歸直線方程，b叫做迴歸係數。要想確定迴歸直線方程

，我們只需確定a與迴歸係數b即可。

設x，Y的一組觀察值爲：

i = 1，2，3……n

其迴歸直線方程爲：

當x取值

(i=1，2，3……n)時，Y的觀察值爲

，差

刻畫了實際觀察值

與迴歸直線上相應點縱座標之間的偏離程度，見下圖：

實際上我們希望這n個離差構成的總離差越小越好，只有如此才能使直線最貼近已知點。換句話說，我們求迴歸直線方程的過程其實就是求離差最小值的過程。

一個很自然的想法是把各個離差加起來作爲總離差。可是，由於離差有正有負，直接相加會互相抵消，如此就無法反映這些數據的貼近程度，即這個總離差不能用n個離差之和來表示，見下圖：

一般做法是我們用離差的平方和，即：

作爲總離差，並使之達到最小。這樣迴歸直線就是所有直線中Q取最小值的那一條。由於平方又叫二乘方，所以這種使“離差平方和爲最小”的方法，叫做最小二乘法。
用最小二乘法求迴歸直線方程中的a、b的公式如下：

其中，

、

爲

和

的均值，a、b的上方加“︿”表示是由觀察值按最小二乘法求得的估計值，a、b求出後，迴歸直線方程也就建立起來了。

當然，我們肯定不能滿足於直接得到公式，我們只有理解這個公式怎麼來的才能記住它，用好它，因此給出上面兩個公式的推導過程更加重要。在給出上述公式的推導過程之前，我們先給出推導過程中用到的兩個關鍵變形公式的推導過程。首先是第一個公式：