Github上Top20 Python與機器學習開源項目推薦

以下內容由公衆號:AIRX社區(國內領先的AI、AR、VR技術學習與交流平臺) 整理

 

TensorFlow

TensorFlow是一個端到端的機器學習開源平臺。由工具、庫和社區資源組成的全面、靈活的生態系統,使開發人員能夠輕鬆地構建和部署基於ML的應用程序。

 

TensorFlow最初是由谷歌機器智能研究組織的谷歌大腦團隊的研究人員和工程師開發的,用於進行機器學習和深度神經網絡研究。該系統具有足夠的通用性,可以廣泛應用於其他領域。

(1)URL:

https://www.tensorflow.org/

(2)Github URL:

https://github.com/tensorflow/tensorflow

 

Scikit-learn

Scikit-learn是用於數據挖掘和數據分析的簡單而高效的工具,每個人都可訪問,並可在各種環境中重用,它建立在NumPy、SciPy和matplotlib之上,是開源的,商業上可用的。

(1)URL:

http://scikit-learn.org/

(2)Github URL:

https://github.com/scikit-learn/scikit-learn

  

Keras

Keras是一個高級的神經網絡API,用Python編寫,能夠在TensorFlow、CNTK或Theano上運行。

 

(1)URL:

https://keras.io/

(2)Github URL:

https://github.com/keras-team/keras

 

PyTorch

Python中具有強大GPU加速和動態神經網絡

 

 

(1)URL:

https://pytorch.org/

(2)Github URL:

https://github.com/pytorch/pytorch

 

Theano

Theano是一個Python庫,允許開發者高效地定義、優化和計算涉及多維數組的數學表達式。它可以使用gpu進行高效的符號微分。

(1)URL:

http://deeplearning.net/software/theano/

(2)Github URL:

https://github.com/Theano/Theano

 

Gensim

Gensim是一個免費的Python庫,具有可伸縮的統計語義、分析純文本文檔的語義結構、檢索語義相似的文檔等功能。

(1)URL:
https://radimrehurek.com/gensim/

(2)Github URL:

https://github.com/RaRe-Technologies/gensim

  

Caffe

Caffe是一種深度學習框架,它考慮了表達式、速度和模塊化。由伯克利視覺與學習中心(BVLC)和社區貢獻者開發的。

(1)URL:

http://caffe.berkeleyvision.org/

(2)Github URL:

https://github.com/BVLC/caffe

 

Chainer

Chainer是一個基於python的、獨立的開源框架,用於深度學習模型。Chainer提供了一種靈活、直觀、高性能的方法來實現全方位的深度學習模型,包括最先進的模型,如遞歸神經網絡和變分自動編碼器。

 

 

(1)URL:

https://chainer.org/

(2)Github URL:

https://github.com/chainer/chainer

 

Statsmodels

Statsmodels是一個Python模塊,允許用戶研究數據、估計統計模型和執行統計測試。描述統計、統計測試、繪圖函數和結果統計的廣泛列表可用於不同類型的數據和估計。

(1)URL:

http://www.statsmodels.org/stable/index.html

(2)Github URL:

https://github.com/statsmodels/statsmodels/

 

Shogun

Shogun是機器學習工具箱,提供了廣泛的統一和有效的機器學習(ML)方法。允許輕鬆地組合多個數據表示、算法類和通用工具。

(1)URL:

http://shogun-toolbox.org/

(2)Github URL:

https://github.com/shogun-toolbox/shogun

 

Pylearn2

Pylearn2是一個機器學習庫。它的大部分功能都建立在Theano之上。這意味着開發者可以使用數學表達式編寫Pylearn2插件(新模型、算法等),Theano將爲其優化和穩定這些表達式,並將它們編譯到你選擇的後端(CPU或GPU)。

(1)URL:

http://deeplearning.net/software/pylearn2/

(2)Github URL:

https://github.com/lisa-lab/pylearn2

 

NuPIC

NuPIC是一個基於新大腦皮層理論的開源項目,該理論被稱爲分級時間記憶(HTM)。HTM理論的部分內容已經實現、測試並在應用中使用,HTM理論的其他部分仍在開發中。

 

(1)URL:

https://numenta.org/

(2)Github URL:

https://github.com/numenta/nupic

 

Neon

Neon是Nervana基於python的深度學習庫。它提供了易用性,同時提供了最高的性能。注意:Intel已經不再支持Neon了,但是你仍然可以通過Github來使用它。

(1)URL:

https://github.com/NervanaSystems/neon

(2)Github URL:

https://github.com/NervanaSystems/neon

 

Nilearn

Nilearn是一個Python模塊,用於對神經成像數據進行快速、簡單的統計學習。它利用scikit-learn Python工具箱進行多元統計,應用程序包括預測建模、分類、解碼或連接性分析。

(1)URL:

https://nilearn.github.io/

(2)Github URL:

https://github.com/nilearn/nilearn

 

Orange3

Orange3是面向新手和專家的開源機器學習和數據可視化工具。具有大型工具箱的交互式數據分析工作流。

(1)URL:

https://orange.biolab.si/

(2)Github URL:

https://github.com/biolab/orange3

 

Pymc

Pymc是一個python模塊,它實現了貝葉斯統計模型和擬合算法,包括馬爾科夫鏈蒙特卡羅。它的靈活性和可擴展性使其適用於大量的問題。

(1)URL:

https://pymc-devs.github.io/pymc/README.html

(2)Github URL:

https://github.com/pymc-devs/pymc

 

Deap

Deap是一種用於快速原型設計和思想測試的新型進化計算框架。它試圖使算法顯式和數據結構透明。它與並行機制(如多處理和凸勺)完美地協調工作。

(1)URL:

https://pypi.org/project/deap/

(2)Github URL:

https://github.com/deap/deap

 

Annoy

Annoy創建了大型的基於只讀文件的數據結構,這些結構被映射到內存中,以便許多進程可以共享相同的數據。

(1)URL:

https://pypi.org/project/annoy/

(2)Github URL:

https://github.com/spotify/annoy

 

PyBrain

PyBrain是Python的一個模塊化機器學習庫。它的目標是爲機器學習任務提供靈活、易於使用但仍然強大的算法,以及用於測試和比較算法的各種預定義環境。

 

(1)URL:

http://pybrain.org/

(2)Github URL:

https://github.com/pybrain/pybrain

 

Fuel

Fuel是一個數據管道框架,它爲你的機器學習模型提供它們需要的數據。它計劃用於模塊和Pylearn2神經網絡庫。

(1)URL:

https://fuel.readthedocs.io/en/latest/

(2)Github URL:

https://github.com/mila-iqia/fuel

 

參考數據:

https://www.dataquest.io/blog/top-20-python-ai-and-machine-learning-open-source-projects/

 

 

可以關注下公衆號(AIRX社區),一個專注AI、AR、VR學習與交流的平臺。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章