本文記錄一下Ubuntu下安裝python關於數據處理的各種包,安裝的方法都非常簡單,直接使用apt-get
1.ipython工具
ipython 是一個 python 的交互式 shell,比默認的python shell 好用得多,支持變量自動補全,自動縮進,支持 bash shell 命令,內置了許多很有用的功能和函數。
sudo apt-get install ipython
2.安裝scipy,numpy,matplotlib
NumPy系統是Python的一種開源的數字擴展。這種工具可用來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。據說NumPy將Python相當於變成一種免費的更強大的Matlab系統。
SciPy是一個開源的Python算法庫和數學工具包。
matplotlib 是python最著名的繪圖庫,它提供了一整套和matlab相似的命令API,十分適合交互式地進行製圖。
sudo apt-get install python-scipy
sudo apt-get install python-numpy
sudo apt-get install python-matplotlib
3.安裝Pandas
Python Data Analysis Library 或 pandas 是連接 SciPy 和 NumPy 的一種工具,該工具是爲了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。
sudo apt-get install python-pandas
4.安裝python機器學習工具
首先是著名的開源ML工具包scikit-learn,這個工具的文檔非常詳細
sudo apt-get install python-sklearn
gensim,這個包是做文本分析用的,它包含了一些基礎的文本處理,和一些模型,LSI,LDA。
官網點擊打開鏈接 ,使用pip,或easy_install安裝,或者直接下載源碼包
sudo python setup.py install