無限假設集(The case of infinite H)

原創

2020-02-26 00:29

我們已經證明了一些在有限假設集下成立的結論。但很多假設類實際包含了無限個函數，這種情況我們是否可以給出相似的結論？

讓我們先舉個不恰當的例子，它有助於我們的直觀理解。

假設集H 的空間由d 個實參數控制。我們用電腦存儲這些實數，而在電腦中一個double類型的實數需要用64位來表示。所以我們的假設類中包含了264d 個假設，由有效假設的結論可知，要保證ε(h^)≤ε(h∗)+2γ 的概率大於1−δ ，樣本數量必須滿足m≥O(1γ2log264dδ)=O(dγ2log1δ)=Oγ,δ(d) ，因此樣本數量和模型參數是線性相關。

用64位浮動點的例子來表示模型參數可能不是很正確，但得出的結論是完全正確的：爲了實現訓練誤差最小化，訓練樣本數和假設類的參數個數線性相關。

VC維(Vapnik-Chervonenkis dimension)的定義：對於任一假設集H ，VC(H) 表示能被假設集H 分割的最大樣本集的樣本數。

例如，含有三個點的樣本集：

對於樣本所有可能的情況，假設集H 是否都能分割？答案是yes。

而對於4個樣本點的情況，咋不能完全分割。

所以VC(H)=3

定理:對任一假設集H ，令d=VC(H) ，概率大於1−δ ，有：

| ε (h) - ε^(h) | \leq O (d m l o g m d + 1 m l o g 1 δ - - - - - - - - - - - - - - - - \sqrt)

還有：

ε (h^) \leq ε (h *) + O (d m l o g m d + 1 m l o g 1 δ - - - - - - - - - - - - - - - - \sqrt)

即是說，如果假設類的VC維是有限數，當樣本數m 足夠大時，假設將會一致收斂。即可以用最優訓練誤差ε(h∗) 表示泛化誤差ε(h) 的範圍。

同理要使|ε(h)−ε^(h)|≤γ 對所有假設成立的概率至少爲1−δ ，樣本數量m 必須滿足：

m = O γ, δ (d) .

由於VC維一般與假設集的參數個數線性相關，所以樣本數（樣本複雜度）與假設集的參數個數線性相關。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

無限假設集(The case of infinite H)

python gdal 安裝使用（Windows， python 3.6.8）

論文翻譯——基於數據的最優直方圖

綜述論文：深度學習在心臟圖像分割的應用

論文翻譯——使用深度卷積網絡處理ImageNet分類

正規化和模型選擇(Regularization and model selection)

資料翻譯——核密度估計簡介

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結