《機器學習(周志華)》Chapter1 緒論 課後習題答案




表1.1 包含4個樣例,3種屬性,假設空間中有3 * 4 * 4 + 1 = 49種假設。在不考慮冗餘的情況下,最多包含k個合取式來表達假設空間,顯然k的最大值是49,每次從中選出k個來組成析合式,共種可能。但是其中包含了很多沉餘的情況(至少存在一個合取式被剩餘的析合式完全包含<空集除外>)。

如果考慮沉餘的情況 在這裏忽略空集,一個原因是並不是太明白空集是否應該加入析合式,另外就算需要加入,求出了前面48種假設的組合,可以很容易求出加入空集後的組合數(每種可能都可以加上空集,再加上1種空集單獨的情況)。 48種假設中: 具體假設:2∗3∗3=18種 一個屬性泛化假設:2∗3+3∗3+2∗3=21種 兩個屬性泛化假設:2+3+3=8種 三屬性泛化:1種


回答1:
1). 通常認爲兩個數據的屬性越相近,則更傾向於將他們分爲同一類。若相同屬性出現了兩種不同的分類,則認爲它屬於與他最臨近幾個數據的屬性。
2). 也可以考慮同時去掉所有具有相同屬性而不同分類的數據,留下的數據就是沒誤差的數據,但是可能會丟失部分信息。
回答2:
1). 定義一個閾值,只要訓練後滿足的樣本數量百分比達到這個閾值即可。
2). 在訓練過程中選擇滿足最多樣本的假設。



NFL首先要保證真目標函數f均勻分佈。對於X個訓練數據的二分類問題,顯然f共有種情況,其中一半是與假設一致的,也就是P(f(x) = h(x)) = 0.5.因此,其中應爲常數,如果性能度量爲錯誤率,二者各爲0.5,則該值爲1,如果爲其他性能度量,根據網友的想法:,應當隱含這樣的充分條件。


https://wenku.baidu.com/view/fd90c73f4b35eefdc8d3335e.html


發佈了27 篇原創文章 · 獲贊 10 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章