Ubuntu下搭建python數據分析環境

本文記錄一下Ubuntu下安裝python關於數據處理的各種包,安裝的方法都非常簡單,直接使用apt-get


1.ipython工具

ipython 是一個 python 的交互式 shell,比默認的python shell 好用得多,支持變量自動補全,自動縮進,支持 bash shell 命令,內置了許多很有用的功能和函數。

sudo apt-get install ipython

2.安裝scipy,numpy,matplotlib

NumPy系統是Python的一種開源的數字擴展。這種工具可用來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。據說NumPy將Python相當於變成一種免費的更強大的Matlab系統。

SciPy是一個開源的Python算法庫和數學工具包。

matplotlib 是python最著名的繪圖庫,它提供了一整套和matlab相似的命令API,十分適合交互式地進行製圖。

sudo apt-get install python-scipy

sudo apt-get install python-numpy

sudo apt-get install python-matplotlib

3.安裝Pandas

Python Data Analysis Library 或 pandas 是連接 SciPy 和 NumPy 的一種工具,該工具是爲了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。

sudo apt-get install python-pandas

4.安裝python機器學習工具

首先是著名的開源ML工具包scikit-learn,這個工具的文檔非常詳細

sudo apt-get install python-sklearn

gensim,這個包是做文本分析用的,它包含了一些基礎的文本處理,和一些模型,LSI,LDA。

官網點擊打開鏈接 ,使用pip,或easy_install安裝,或者直接下載源碼包

sudo python setup.py install



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章