西瓜書第一章總結

原創

心静菩提现

2019-05-12 23:27

西瓜書第一章總結

參考文獻

1.版本空間

在對假設空間進行搜索的過程中，不斷的刪除與正例不一致的假設以及與反例一致的假設，最終會獲得與訓練集一致的假設，由於現實問題中常常面臨很大的假設空間，而學習過程是基於有限樣本訓練集進行的，所以可能會有多個假設和訓練集一致，該多個假設組成的假設集合稱爲版本空間。

2.沒有免費的午餐定理

對於一個學習算法λa，若它在某些問題上比學習算法λb好，則必然在另一些問題上，在那裏λb比λa好。下面進行簡單證明
假設樣本空間X和假設空間H都是離散的。令P(h|X‘,λa)代表算法λa基於訓練數據X’產生假設h的概率
，令f代表希望學習的真實目標函數，λa的訓練集外誤差即λa在訓練集之外的所有樣本上的誤差爲

考慮二分類問題，且真實目標函數可以是任何函數X->{0,1}，函數空間爲{0,1}^|x|，對所有可能的f按照均勻分佈對誤差求和，有

上式表明，總誤差與學習算法無關，即對於任意兩個學習算法λa和λb

引申(課後習題)
上述採用分類錯誤率作爲性能度量來進行對分類器進行評估。若換用其他性能度量L,則上式將改爲

,試證明沒有免費的午餐定理仍成立
證明如下

將l(h(x),f(x))看作損失函數，則
爲定值，設該定值爲M,
即上式等價於
即

參考文獻

[1] 周志華.[機器學習]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

西瓜書——第三章課後習題

題3.1 試析在什麼情況下f(x)=w^(T)+b中不必考慮偏置項b 首先要知道爲什麼要加偏置項？它的作用是什麼？在之前學過的一次函數中，b其實就是函數在y軸的截距，控制着函數偏離原點的距離，那麼在線性模型中應該也是類似作用。

2020-07-03 18:22:22

西瓜書之決策樹的一生

最近看西瓜書的決策樹這一章，給我看懵了。感覺得自己動手一步一步計算才能理解具體怎麼構造的，然後才能寫程序。就以書上的西瓜集2.0爲例： 1.先搞清兩個概念：信息熵和信息增益信息熵越小，純度越高。計算公式如下：條件熵：

2020-07-03 18:22:22

lesson-03-多維向量版本 (1)

import numpy as np import random class Node: def __init__(self, inputs=[]): self.inputs = inputs

2020-07-01 16:39:30

Lecture-02-Search-Policy-and-Simple-Machine-Learning

問題描述大家好，我們在用 networkx 顯示中文的時候，會發現不能顯示中文。解決辦法下載Github倉庫中的字體SimHei.ttf；在 jupyter notebook 中執行 import matplotlib

2020-07-01 16:39:29

機器學習筆記——緒論

機器學習基本概念定義：致力於研究如何通過計算的手段，利用經驗來改善系統自身的吸能。研究的主要內容他:在計算機上從數據中產生“模型”的算法，可以說機器學習是研究關於“學習算法”的學問基本術語要進行機器學習，先要有數據，通

weixin_43249938

2020-06-30 22:08:02

再學西瓜書----chapter6 支持向量機SVM

Page 121~Page 123 比較好的推文可以參考這篇，講的比西瓜書詳細關於svm的推導不準備贅述了，這裏只注重結論，超平面 wTx+ b = 0 對於線性可分的情況，超平面其實是我們需要求的東西支持向量就是離超平面

2020-06-29 23:11:09

周志華《機器學習》（西瓜書）學習筆記——第五章神經網絡

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第十章降維與度量學習

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第八章集成學習

2020-06-26 05:15:42

周志華《機器學習》（西瓜書）學習筆記——第六章支持向量機

2020-06-26 05:15:42

【和我一起學西瓜書】機器學習各章節思維導圖（更新中）

2020-06-25 20:46:38

【和我一起學西瓜書】1.緒論-術語列表

重要術語：記錄 / 樣本（sample）/ 示例（instance）數據集（data set）屬性（attribute）/ 特徵（feature）屬性值（attribute value）屬性空間（attribute s

2020-06-25 19:19:58

【和我一起學西瓜書】沒有免費的午餐定理NFL

關於沒有免費的午餐定理的證明，推薦兩篇博客： https://blog.csdn.net/weixin_41370083/article/details/81666357 https://blog.csdn.net/u013238

2020-06-25 19:19:41

異常檢測實戰

數據科學導論 python語言實現一、單變量異常檢測（一次觀測一個變量） 1.1 Z-scores 得分絕對值超過3的 1.2 箱線圖 import numpy as np from sklearn import preproce

上进的菜鸟

2020-06-23 20:09:29

從組合中估計概率

一些分類算法缺乏輸出結果爲概率的能力，比如rf 這個時候使用calibratedclassifiercv，它使用2種方法將分類結果轉化爲概率第一種：platte的歸類方法第二種：isotonic迴歸 import pandas as

上进的菜鸟

2020-06-23 20:09:29

24小時熱門文章

最新文章

最新評論文章