分類預測&聚類

原創

un_lock

2020-06-16 07:07

分類預測&聚類

分類和聚類的不同，點擊進行學習。

聚類

什麼是聚類分析

簇

一個數據對象的集合

聚類分析(無監督)

把一個給定的數據對象分成不同的簇
在同一個簇中，對象之間具有相似性
不同簇的對象之間是相異的

典型應用

模式識別
空間數據分析
圖像處理
經濟學(市場研究)
分檔分類

eg：市場營銷、土地使用、保險、城市規劃、地震研究

數據挖掘對聚類的要求

可伸縮性
能夠處理不同類型的屬性
能發現任意形狀的簇
能夠處理噪聲和異常
對輸入數據隨想的順序不敏感
能處理高維數據
能產生一個好的，滿足用戶指定約束的聚類結果
結果是可解釋的、可理解的和可用的

評價方法

一個好的聚類方法要能產生高質量的聚類結果—簇，這些簇具有一下兩個特點：

高的簇內相似性
低的簇間相似性

So，如何計算相似性

通常使用距離來衡量兩個對象之間的相異度。

明考斯基距離(Minkowski distance):

相似性

So，如何計算相似性

通常使用距離來衡量兩個對象之間的相異度。

明考斯基距離(Minkowski distance):

[外鏈圖片轉存中…(img-kSASuJsQ-1591021899119)]
簡單匹配係數----評價二元變量之間的相似性

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分類預測&聚類

分類預測&聚類

分類

概念

預測

有監督學習(分類)

無監督學習(聚類)

關於分類和預測的問題

決策樹

Overfitting

SLIQ算法

貝葉斯分類算法

粗糙集算法

聚類

什麼是聚類分析

簇

聚類分析(無監督)

典型應用

數據挖掘對聚類的要求

評價方法

So，如何計算相似性

So，如何計算相似性

Nginx R31 doc 官方文檔-01-nginx 如何安裝

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Paddle_程序員必備的數學知識_轉發

一篇博客入門pandas模塊

一篇博客入門Numpy模塊

Numpy模塊下np.clip()方法的使用

數據挖掘和數據倉庫

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結