周志華《Machine Learning》學習拓展知識--經驗風險與結構風險

原創

努力进行光合作用

2020-02-21 03:58

在前面幾章的筆記中，都出現了“正則化”這個看似神祕的東西，具體包括：（1）線性模型的最小二乘法中出現非滿秩或正定矩陣的情形，從而引入正則化解決了求逆矩陣的難題；（2）BP神經網絡爲了避免過擬合而引入的正則項；（3）“軟間隔”支持向量機在優化目標中添加的正則項或懲罰項。下面將主要圍繞這三個方面來闡述經驗風險與結構風險。

風險函數度量的是平均意義下模型訓練的好壞。在模型學習的過程中，對於監督學習，通常使用帶有真實標記的數據來學習出模型的參數，使得該模型對於訓練數據儘可能地都預測正確。但是模型每一次預測值可能與真實標記相同，也可能不一致，一般我們採用損失函數來度量模型預測錯誤的程度，常用的損失函數有以下幾種：

（引自李航教授的《統計學習方法》）

模型關於訓練數據的平均損失稱爲“經驗風險”，經驗風險度量的是模型與訓練數據的契合程度，即模型的優劣程度。如下所示：

但單純地優化經驗風險容易導致過擬合，因此引入了“結構風險”，結構風險度量的是模型的某些性質，例如模型的複雜度或懲罰項等。如下所示：

其中λ是一個係數，將經驗風險與結構風險二者進行折中，這就是上面提到的“正則化”問題，通過引入正則項有效地降低了過擬合的風險，這樣監督學習問題就變成了經驗風險或結構風險最小的最優化問題。下面將圍繞三個實際的例子來進行討論。

（1）最小二乘法引入正則化

在多元線性迴歸中，對w進行參數估計時，出現了一個限定條件，即X’X爲滿秩矩陣或正定矩陣。如下所示：

在現實問題中，由於數據的多樣性和不確定性，難免會出現列相關的情形，爲了避免這個問題，從而引入了正則化。

引入正則化後，雖然對係數的估計是有偏的，但結果卻更加穩定。這一問題又稱爲“嶺迴歸”，嶺迴歸實質上就是帶有二範數懲罰項的最小二乘法。

（2）神經網絡引入正則化

由於神經網絡模型強大的表示能力，BP神經網絡經常遭遇過擬合，解決過擬合策略中的其中一種就是引入正則化，在經驗風險後加上一個表示模型複雜程度的懲罰項，從而將優化目標從“經驗風險”變爲“結構風險”，如下所示：

（3）SVM引入正則化

在“軟間隔”支持向量機中，在引入鬆弛變量後，在優化目標函數後添加了一個懲罰項，使得不滿足約束的樣本點儘可能少。這便是將“經驗風險”轉化爲“結構風險”，因此軟間隔SVM可以理解爲最優化+損失最小。

努力進行光合作用

發佈了35 篇原創文章 · 獲贊 220 · 訪問量 22萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

機器學習--Logistic Regression(scikit-learn_ 預測疝氣病症病馬死亡率問題)

據說，心情不好的時候，整理東西可以讓好心情迴歸，那麼同理，懶散得想要沉淪時候，總結知識可以召回學習的神龍。學習回顧：認識sklearn：scikit-learn，Python庫之一，Scipy（Scientific Pyt

2020-07-07 03:34:08

Detectron2源碼分析- demo-對象檢測

python demo/demo.py --config-file configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml --input 001.jpg –out

维民所止1226

2020-07-07 00:30:30

條件隨機場CRF(Conditional Random Field)

⼀個重要的要求是，我們保留了推斷的⾼效算法，它與鏈的長度是線性關係。例如，這要求，在給定觀測的條件下，表⽰的後驗概率分佈的量在與轉移概率和發射概率相乘然後在上求和或積分之後，我們得到的上的概率分佈與上的概率分佈具有相同的函數

2020-07-06 21:30:11

lightgbm(gpu)在linux(centos7)安裝

#保證gpu是正常可用的： nvidia-smi nvcc -V #進入root權限，且python環境爲你正常使用環境，比如anaconda3，而不是python2.7 #依賴：sudo apt-get install --n

2020-07-06 10:25:20

極簡單Ubntu18.10安裝TF,Keras,PyTorch (cpu版)以及jupyter notebook並配置遠程訪問小記

1.安裝Anaconda Anaconda安裝基本大家都會很容易，直接在ubantu中打開瀏覽器在官網下載對應系統版本的.sh文件即可。然後使用sh命令安裝。 sudo sh /home/file_name/Ana

2020-07-05 16:20:01

彩票理論

神經網絡壓縮是人工智能落地過程中重要的一個環節。關於網絡壓縮的理論之前就已經有很多，比如，模型蒸餾，剪枝，量化，低秩矩陣近似等。彩票理論算是個令人耳目一新的觀點，值得看看。摘要：神經網絡修剪技術可以將訓練有素的網絡的參數數量減少90％

2020-07-05 08:54:49

實際使用中的神經網絡壓縮

引起這篇綜述的緣由是論文《Neural Network Distiller: A Python Package ForDNN Compression Research》，這種實用工具會使我對這一充滿希望的方向充值一點希望。除了Distil

2020-07-05 08:54:49

《機器學習原理算法應用》筆記

文章目錄簡介數學基礎算法基礎貝葉斯分類器決策樹k近鄰數據降維線性判別分析人工神經網絡支持向量機線性模型隨機森林Boosting深度學習卷積神經網絡循環神經網絡生成對抗網絡聚類半監督學習隱馬爾可夫模型條件隨機場強化學習工程實現相關

2020-07-04 07:32:17

完美解決 Spark：java.net.URISyntaxException: Relative path in absolute URI: file:D:/XXX/

windows下使用intellij 開發 spark mllib 程序發現如下錯誤。 var spark=SparkSession.builder().master("local").appName("test").getOrCre

2020-07-03 20:58:58

機器學習2018-12-28

機器學習組成主要任務分類（classification）：將實例數據劃分到合適的類別中。應用實例：判斷網站是否被黑客入侵（二分類），手寫數字的自動識別（多分類）迴歸（regression）：主要用於預測數值型數據應用實

2020-07-03 14:03:40

推薦系統常用評估指標對比

制定評估指標是數據挖掘前期很重要的一步，一個好的評估指標要和關心的業務指標波動一致。這樣可以通過對比不同模型的評估指標，來評價模型在實際業務中的效果，加快模型迭代週期，降低線上成本。在推薦系統中評估指標可以分爲三類：分類指標，迴

2020-07-03 11:44:06

單變量線性迴歸實現波士頓房價預測

1、預測過程（1）、波士頓地區房價數據獲取，數據來自於sklearn自帶數據集；（2）、波士頓地區房價數據分割；（3）、訓練與測試數據標準化處理；（4）、使用最簡單的線性迴歸模型LinearRegression對房價進行預測。 2

2020-07-03 04:26:27

SVM算法檢測XSS注入

目錄 XSS注入檢測 GitHub地址: https://github.com/ielcome2017/xss.git 1. 項目結構 2. 過程 3. 結果 4. 使用 GitHub地址: https://github.com/iel

2020-07-03 00:16:57

Keras強化學習——FlappyBird

github地址：https://github.com/ielcome2017/FlappyBird.git 代碼數據生成 import numpy as np import sys import cv2 import ra

2020-07-03 00:16:46

理解Theano的Scan函數

1 Scan是幹什麼的函數scan是Theano中迭代的一般形式，所以可以用於類似循環(looping)的場景。如果你熟悉Reduction和map兩個函數，這兩個都是scan的特殊形式，即將某函數依次作用一個序列的每個元素

2020-07-02 22:57:02

24小時熱門文章

最新文章

最新評論文章