數據分析與挖掘相關模塊簡介

  1. numpy可以高效處理數據、提供數組支持、很多模塊都依賴它,比如pandas、scipy、matplotlib都依賴它,所以這個模塊是基礎。
  2. pandas我們課程後續用的最多的一個模塊,主要用於進行數據探索和數據分析。
  3. matplotlib作圖模塊,解決可視化問題。
  4. scipy主要進行數值計算,同時支持矩陣運算,並提供了很多高等數據處理功能,比如積分、傅里葉變換、微分方程求解等。
  5. statsmodels這個模塊主要用於統計分析。
  6. Gensim這個模塊主要用於文本挖掘。
  7. sklearn、keras前者機器學習,後者深度學習。

模塊安裝的順序與方式建議如下:

  1. numpy、mkl(下載安裝) https://www.lfd.uci.edu/~gohlke/pythonlibs/
    numpy‑1.16.5+mkl‑cp27‑cp27m‑win_amd64.whl
  2. pandas(網絡安裝)
  3. matplotlib(網絡安裝)
  4. scipy(下載安裝)
  5. statsmodels(網絡安裝)
  6. gensim(網絡安裝 )
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章