(一)Classification(分類算法)
完全支持:
1.Logistic Regression(Logistic迴歸)
2.Naive Bayes/ Complementary Naive Bayes(樸素貝葉斯/互補的樸素貝葉斯)
3.Random Forests(隨機森林)
4.Hidden Markov Models(隱馬爾可夫模型)
即將支持:
5.Online Passive Aggressive(在線被動攻擊)
(二)Dimension reduction(聚類算法)
完全支持:
1.Canopy Clustering(Canopy聚類)
2.K-Means Clustering(K-Means聚類)
3.Fuzzy K-Means(模糊K-Means聚類)
4.Mean Shift Clustering(均值漂移聚類)
5.Dirichlet Process Clustering (狄利克雷過程聚類)
6.Latent Dirichlet Allocation(潛在狄利克雷分配)
7.Minhash Clustering(Minhash聚類)
8.kMeans++ streaming clustering(k均值+ +流媒體集羣)
即將支持:
9.Hierarchical Clustering(層次聚類)
10.Spectral Clustering(譜聚類)
(三)Dimension reduction(降維)
完全支持
1.Singular Value Decomposition and other Dimension Reduction Techniques(奇異值分解和其他降維技術)
2.Stochastic Singular Value Decomposition with PCA workflow(隨機奇異值分解與PCA工作流程)
即將支持:
3.Principal Components Analysis(主成分分析)
4.Gaussian Discriminative Analysis(高斯辨析)
(四)Evolutionary Algorithms(進化算法)
注:進化算法已經在mahout0.7版本中移除了。
(五)推薦引擎/協同過濾(Recommenders/Collaborative Filtering)
Mahout中包含了簡單非分佈式推薦引擎的實現和基於hadoop分佈式推薦引擎的實現。
算法類 |
算法名 |
中文名 |
分類算法 |
Logistic Regression |
邏輯迴歸 |
Bayesian |
貝葉斯 |
|
SVM |
支持向量機 |
|
Perceptron |
感知器算法 |
|
Neural Network |
神經網絡 |
|
Random Forests |
隨機森林 |
|
Restricted Boltzmann Machines |
有限波爾茲曼機 |
|
聚類算法 |
Canopy Clustering |
Canopy聚類 |
K-means Clustering |
K均值算法 |
|
Fuzzy K-means |
模糊K均值 |
|
Expectation Maximization |
EM聚類(期望最大化聚類) |
|
Mean Shift Clustering |
均值漂移聚類 |
|
Hierarchical Clustering |
層次聚類 |
|
Dirichlet Process Clustering |
狄裏克雷過程聚類 |
|
Latent Dirichlet Allocation |
LDA聚類 |
|
Spectral Clustering |
譜聚類 |
|
關聯規則挖掘 |
Parallel FP Growth Algorithm |
並行FP Growth算法 |
迴歸 |
Locally Weighted Linear Regression |
局部加權線性迴歸 |
降維/維約簡 |
Singular Value Decomposition |
奇異值分解 |
Principal Components Analysis |
主成分分析 |
|
Independent Component Analysis |
獨立成分分析 |
|
Gaussian Discriminative Analysis |
高斯判別分析 |
|
進化算法 |
並行化了Watchmaker框架 |
|
推薦/協同過濾 |
Non-distributed recommenders |
Taste(UserCF, ItemCF, SlopeOne) |
Distributed Recommenders |
ItemCF |
|
向量相似度計算 |
RowSimilarityJob |
計算列間相似度 |
VectorDistanceJob |
計算向量間距離 |
|
非Map-Reduce算法 |
Hidden Markov Models |
隱馬爾科夫模型 |
集合方法擴展 |
Collections |
擴展了java的Collections類 |