1.7 生成模型與判別模型

監督學習方法可以分爲：生成方法與判別方法，與此對應生成模型與判別模型。

生成方法即由數據學習聯合概率分佈（P（x，y）），再由概率條件分佈（p（y|x））作爲預測的模型，即是生成模型：

之所以命名爲生成方法，是因爲模型給出了輸入X產生輸出Y的生成關係。典型的生成模型有：樸素貝葉斯法及隱性馬爾科夫模型。

判別方法 由數據直接學習決策函數f（x）或者條件概率分佈P（Y|X）作爲預測的模型，即判別模型，其關心的主要是給定特定的輸入X，應該預測什麼樣的輸出Y。典型的判別模型包括：k近鄰法，感知機，決策樹，邏輯斯特迴歸模型，最大熵模型，支持向量機，提升方法以及條件隨機場等。

區別：生成方法可以還原聯合概率分佈P（x，y），收斂速度快，可以應用於存在隱變量的情況下。

判別方法學習準確率高，可以對數據進行各種程度上的抽象、定義特徵並使用特徵，簡化學習問題。

1.8 分類問題

當監督學習中輸出變量取離散的值時，預測問題便成爲分類問題，這時，輸入變量X可以爲離散的，也可以爲連續的，監督學習從數據當中學習一個分類模型或者分類決策函數，成爲分類器，分類器對新的輸入進行輸出的預測，稱爲分類，可能的輸出稱爲類，分類的類別爲多個時，稱爲多類分類問題。

分類分爲：學習和分類兩大過程。

process：在學習的過程中，利用學習方法學習一個分類器，在分類過程中，利用分類器對新的輸入數據進行分類。

評價分類器的指標一般是分類準確率，其定義是：對於給定是數據，其分類正確率與總數據之比。

對於二類問題，其評價指標爲：準確率與召回率。以關注的類爲正類，其他類爲負類。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.