引入
數據中變量的相關關係是爲我們做出預測的基本前提
例子
用戶的性別和所使用手機的品牌之間的關係
觀察數據:
可以看出,有三分之二的女性喜歡的是iphone手機
如果再給我們6個女性用戶,我們就會正確判斷4次,錯誤判斷2次
y銷售額
x在電視、社交、電話等媒體的廣告投入
x和y同一個時間單位上
研究電視廣告和銷售額的關係:
怎麼判斷這條線的好壞呢
迴歸線變成方程:
加入隨機誤差項
多加入解釋變量
變成
多元線性迴歸方程
這個p值等於驗證統計顯著性的p值
迴歸分析雖然是最常見的分析方法,但它背後是有很複雜的統計假設
比如:
迴歸於分類的區別