本文是根據Stefan Kojouharov發表在Medium上的文章整理而成的一份人工智能、神經網絡、機器學習、深度學習和大數據方面的速查表。爲了便於查找與使用,本文對每個主題進行了分類,希望可以對各位的工作有所幫助。
注意!這可能是相關領域最全的的一份速查表,文末還列出了各種算法的複雜度統計。
神經網絡
神經網絡圖
機器學習概覽
機器學習:Scikit-learn 算法
如果在你的項目中出現了一些未知問題,那麼這份機器學習速查表可以幫助你快速地找到出問題的那部分。下面這個流程圖可以幫助你快速的瀏覽文檔並快速導航,這可以幫助你更深入的理解問題的原因,同時爲你提供對應的解決方案。
Scikit-Learn
Scikit-learn(原scikits.learn) 是基於Python的一款免費機器學習庫。它涵蓋了很多分類、迴歸以及聚類算法,包括支持向量機、隨機森林、梯度加速、k-means聚類以及DBSGAN聚類算法。該庫可以與Python的科學計算庫Numpy以及SciPy互操作。
機器學習:算法速查表
這份來自微軟Azure的機器學習速查表可以幫助你在解決方案的預分析過程中快速選擇合適的機器學習算法。使用這份速查表時,你可以根據自己的目的和數據特徵快速地選擇對應的算法。
Python的數據科學相關功能
TensorFlow
2017年5月,Google發佈了第二代TPU(張量計算單元),同時在谷歌計算引擎上提供了TPU集羣。第二代TPU提供了高達每秒180萬億次的浮點數運算能力,由64個TPU組成的集羣可以提供每秒1.15億億次的浮點數運算能力。
Keras
2017年,Google的TensorFlow團隊決定在TensorFlow的核心庫中添加Keras支持。Ghollet解釋說,Keras是按接口來設計的,而不是一個端到端的機器學習框架。它代表着更高級、更直觀的使用方式,這使得配置神經網絡變得更爲簡單,用戶不需要再去了解複雜的後端科學計算庫。
Numpy
Numpy 旨在作爲Python的CPython參考實現,它是一個非優化的字節碼解釋器。針對這個Python版本編寫的一些數學算法通常比相同代碼的編譯版本慢一些。Numpy通過提供多維數組和函數,以及在數組上的高效運算符來解決運算緩慢的問題,這需要需要重寫一些代碼,主要是使用NumPy的一些內循環。
Pandas
“Pandas” 這個名稱來源於術語 “面板數據”, 這是多維結構化數據集的一個計量經濟學術語。
數據清洗
“數據清洗”正逐漸滲入流行文化。在2017年的電影《金剛:骷髏島》中,由Marc Evan Jackson扮演的角色Steve Woodward就是一位數據清洗師。
使用dplyr和tidyr進行數據清洗
Scipy
Scipy是基於Numpy數組對象的一個科學計算庫,它是NumPy全家桶(包括Matplotlib、Pandas、SymPy等工具包)的一部分,也是科學計算庫的一個擴展集。這個Numpy全家桶與其他應用程序(如MATLAB、GNU Octave和Scilab)有很多共同的用戶。NumPy全家桶有時也被稱爲SciPy全家桶。
Matplotlib
Matplotlib是一個面向Python編程語言及其數學計算庫NumPy的繪圖工具庫。Matplotlib提供了面向對象的API,它使用通用的GUI工具包(例如Tkinter、wxPython、Qt或者GTK+)。雖然也有基於狀態機的程序接口“pylab“(像OpenGL),其設計與MATLAB非常相似,但是大家卻不提倡使用它。SciPy使用了matplotlib。
pyplot是matplotlib中的一個模塊,提供類似MATLAB的接口。按照設計,Matplotlib可以跟MATLAB一樣使用,你可以在Python中使用它,並且是免費的。
數據可視化
PySpark
Big-O(時間複雜度)
關於作者
Stefan是Chatbot’s Life的創始人,這是一家聊天機器人媒體和諮詢公司。到目前爲止,Chatbot’s Life每月的瀏覽量超過了150k,成了在線學習Bots&AI的優質資源。同時,Chatbot’s Life還爲多家頂級機器人企業提供諮詢工作,例如Swelly、Instavest、OutBrain和NearGrop。
查看英文原文:Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning & Big Data