西瓜書第二章：模型評估與選擇

原創

2018-09-04 17:54

訓練誤差（traning error）：學習器在訓練集上的誤差，訓練誤差極小可能產生過擬合（overfitting）。

泛化誤差（generalization erro）：學習器在新樣本上的誤差，泛化誤差極小可能產生欠擬合（underfitting）。

在機器學習的過程中會將數據分爲訓練集（training set)、驗證集（development set）和測試集（test set），其中訓練集用於訓練模型，驗證集用於評估測試的數據集，測試集是對最終的神經網絡做無偏估計。而一般來說我們需要保證訓練集和測試集的數據符合同一分佈。

留出法（hold-out）：將D劃分爲兩個互斥的集合，其中一個作爲訓練集，另一個作爲測試集。

交叉驗證法（cross validation）：將數據集D劃分爲k個大小相似的互斥子集，每個子集都儘可能數據分佈的一致性，每次用k-1個子集的並集作爲訓練集，餘下的作爲測試集，這樣可以得到k組訓練/測試集，從而可進行k詞訓練和測試，最終返回這k個測試結果的均值，這種方法也被稱爲“k折交叉驗證”（k-fold cross validation）。若D中有m個元素，且我們將數據集分爲m個子集，此時可得到交叉驗證法中的一個特例留一法（Leave-One-Out）。

自助法（bootstrapping）：給定包含m個樣本的數據集D，對其進行採樣產生數據集D'：每次隨機從D中挑選一個拷貝放入D'，重複m次可得到包含m個樣本的數據集D'，每個樣本抽到的可能性爲1/m。，即在m次採樣中有36.8%的數據可能未被選擇，若將D'作爲訓練集，D\D'（\表示減法）作爲測試集，這樣的測試結果稱爲“包外估計”（out-of-bag estimate）。

性能度量（performance measure）：衡量模型泛化能力的評價標準，迴歸任務中常用均方誤差（mean squared error).

錯誤率：。

精度：。

查準率（precision）：找到正確樣本中實際爲正確的樣本在找到的正確樣本中的比例。

查全率（recall）：找到的正確樣本中實際爲正確的樣本在所有正確樣本中的比例。

平衡點（break-even point）：查準率=查全率的點，在該點預測結果與真實情況一致。

F1度量：，，其中度量了查全率對查準率的重要性，大於1時查全率影響更大，小於1時查準率影響更大。

ROC（受試者工作特性）曲線：根據學習器的預測結果對樣例進行排序，按此順序逐個把樣本作爲正例進行預測，以FP爲橫軸，以TP爲縱軸繪製的曲線。首先將TP和FP初始化爲0，一次對每個樣例劃分正例，設前一個標記點座標爲（x,y），若爲TP，則對應標記點的座標爲；若爲FP，則對應標記點的座標爲.

AUC（area under ROC curve）：ROC曲線下的面積。

假設檢驗（hypothesis test）：根據問題的需要對所研究的總體做某種假設H，選取合適的統計量，有實測的樣本計算出統計量的值，並根據預先給定的顯著性水平進行檢驗，做出拒絕或接受假設H的判斷。假設是對學習器泛化錯誤率分佈的某種判斷或猜想。

方差（使用樣本數相同的不同訓練集產生的差值）：

噪聲：

偏差（期望輸出與真實標記之間的差值）：

泛化誤差：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

西瓜書——第三章課後習題

題3.1 試析在什麼情況下f(x)=w^(T)+b中不必考慮偏置項b 首先要知道爲什麼要加偏置項？它的作用是什麼？在之前學過的一次函數中，b其實就是函數在y軸的截距，控制着函數偏離原點的距離，那麼在線性模型中應該也是類似作用。

2020-07-03 18:22:22

西瓜書之決策樹的一生

最近看西瓜書的決策樹這一章，給我看懵了。感覺得自己動手一步一步計算才能理解具體怎麼構造的，然後才能寫程序。就以書上的西瓜集2.0爲例： 1.先搞清兩個概念：信息熵和信息增益信息熵越小，純度越高。計算公式如下：條件熵：

2020-07-03 18:22:22

lesson-03-多維向量版本 (1)

import numpy as np import random class Node: def __init__(self, inputs=[]): self.inputs = inputs

2020-07-01 16:39:30

Lecture-02-Search-Policy-and-Simple-Machine-Learning

問題描述大家好，我們在用 networkx 顯示中文的時候，會發現不能顯示中文。解決辦法下載Github倉庫中的字體SimHei.ttf；在 jupyter notebook 中執行 import matplotlib

2020-07-01 16:39:29

機器學習筆記——緒論

機器學習基本概念定義：致力於研究如何通過計算的手段，利用經驗來改善系統自身的吸能。研究的主要內容他:在計算機上從數據中產生“模型”的算法，可以說機器學習是研究關於“學習算法”的學問基本術語要進行機器學習，先要有數據，通

weixin_43249938

2020-06-30 22:08:02

再學西瓜書----chapter6 支持向量機SVM

Page 121~Page 123 比較好的推文可以參考這篇，講的比西瓜書詳細關於svm的推導不準備贅述了，這裏只注重結論，超平面 wTx+ b = 0 對於線性可分的情況，超平面其實是我們需要求的東西支持向量就是離超平面

2020-06-29 23:11:09

周志華《機器學習》（西瓜書）學習筆記——第五章神經網絡

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第十章降維與度量學習

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第八章集成學習

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第六章支持向量機

2020-06-26 05:15:42

【和我一起學西瓜書】機器學習各章節思維導圖（更新中）

2020-06-25 20:46:38

【和我一起學西瓜書】1.緒論-術語列表

重要術語：記錄 / 樣本（sample）/ 示例（instance）數據集（data set）屬性（attribute）/ 特徵（feature）屬性值（attribute value）屬性空間（attribute s

2020-06-25 19:19:58

【和我一起學西瓜書】沒有免費的午餐定理NFL

關於沒有免費的午餐定理的證明，推薦兩篇博客： https://blog.csdn.net/weixin_41370083/article/details/81666357 https://blog.csdn.net/u013238

2020-06-25 19:19:41

異常檢測實戰

數據科學導論 python語言實現一、單變量異常檢測（一次觀測一個變量） 1.1 Z-scores 得分絕對值超過3的 1.2 箱線圖 import numpy as np from sklearn import preproce

上进的菜鸟

2020-06-23 20:09:29

從組合中估計概率

一些分類算法缺乏輸出結果爲概率的能力，比如rf 這個時候使用calibratedclassifiercv，它使用2種方法將分類結果轉化爲概率第一種：platte的歸類方法第二種：isotonic迴歸 import pandas as

上进的菜鸟

2020-06-23 20:09:29

24小時熱門文章

最新文章

最新評論文章