- numpy可以高效處理數據、提供數組支持、很多模塊都依賴它,比如pandas、scipy、matplotlib都依賴它,所以這個模塊是基礎。
- pandas我們課程後續用的最多的一個模塊,主要用於進行數據探索和數據分析。
- matplotlib作圖模塊,解決可視化問題。
- scipy主要進行數值計算,同時支持矩陣運算,並提供了很多高等數據處理功能,比如積分、傅里葉變換、微分方程求解等。
- statsmodels這個模塊主要用於統計分析。
- Gensim這個模塊主要用於文本挖掘。
- sklearn、keras前者機器學習,後者深度學習。
模塊安裝的順序與方式建議如下:
- numpy、mkl(下載安裝) https://www.lfd.uci.edu/~gohlke/pythonlibs/
numpy‑1.16.5+mkl‑cp27‑cp27m‑win_amd64.whl - pandas(網絡安裝)
- matplotlib(網絡安裝)
- scipy(下載安裝)
- statsmodels(網絡安裝)
- gensim(網絡安裝 )