機器學習(統計學習方法)4

生活有懶散,而我仍拖懶~哭

Day 4

1.7 生成模型與判別模型

           監督學習方法可以分爲:生成方法與判別方法,與此對應生成模型與判別模型。

      生成方法即由數據學習聯合概率分佈(P(x,y)),再由概率條件分佈(p(y|x))作爲預測的模型,即是生成模型:


           之所以命名爲生成方法,是因爲模型給出了輸入X產生輸出Y的生成關係。典型的生成模型有:樸素貝葉斯法及隱性馬爾科夫模型。

       判別方法 由數據直接學習決策函數f(x)或者條件概率分佈P(Y|X)作爲預測的模型,即判別模型,其關心的主要是給定特定的輸入X,應該預測什麼樣的輸出Y。典型的判別模型包括:k近鄰法,感知機,決策樹,邏輯斯特迴歸模型,最大熵模型,支持向量機,提升方法以及條件隨機場等。

區別:生成方法可以還原聯合概率分佈P(x,y),收斂速度快,可以應用於存在隱變量的情況下。

          判別方法學習準確率高,可以對數據進行各種程度上的抽象、定義特徵並使用特徵,簡化學習問題。

1.8 分類問題

當監督學習中輸出變量取離散的值時,預測問題便成爲分類問題,這時,輸入變量X可以爲離散的,也可以爲連續的,監督學習從數據當中學習一個分類模型或者分類決策函數,成爲分類器,分類器對新的輸入進行輸出的預測,稱爲分類,可能的輸出稱爲類,分類的類別爲多個時,稱爲多類分類問題。
分類分爲:學習和分類兩大過程。
process:在學習的過程中,利用學習方法學習一個分類器,在分類過程中,利用分類器對新的輸入數據進行分類。

評價分類器的指標一般是分類準確率,其定義是:對於給定是數據,其分類正確率與總數據之比。
對於二類問題,其評價指標爲:準確率與召回率。以關注的類爲正類,其他類爲負類。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章