數據分析——數據探索

數據質量分析

主要檢查原始數據中是否存中髒數據:

  1. 缺失值
  2. 異常值
  3. 不一致的值
  4. 重複數據及含有特殊符號的數據

缺失值

處理方式:刪除、插補、不處理

異常值

  1. 簡單統計量分析
  2. 3σ原則
  3. 箱型圖分析

數據特徵分析

  1. 分佈分析
    定量或定性分析,一般用直方圖,餅圖等
  2. 對比分析
  3. 統計量分析
    1)集中度
    2)離中度
  4. 週期性分析
  5. 貢獻度分析
  6. 相關性分析
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章