背景
由於工作原因,有幸接觸並使用了mahout,mahout是一個apache開源的項目,直譯爲馴象人,實際上是一個數據挖掘的框架,可以和hadoop,spark,storm等結合使用,用於處理大數據。mahout比較吸引人的地方是,有很多數據挖掘需要的算法,mahout已經寫成包,如果沒有特殊需求,不懂java的人也可以直接拿來使用,例如協同過濾、聚類算法等。
由於工作原因,有幸接觸並使用了mahout,mahout是一個apache開源的項目,直譯爲馴象人,實際上是一個數據挖掘的框架,可以和hadoop,spark,storm等結合使用,用於處理大數據。mahout比較吸引人的地方是,有很多數據挖掘需要的算法,mahout已經寫成包,如果沒有特殊需求,不懂java的人也可以直接拿來使用,例如協同過濾、聚類算法等。
package test.mahout.recommendation; import java.io.File; import java.io.IO