原创 Mahout協同推薦簡單實例

上篇文章介紹了協同過濾的安裝與配置,這篇找了幾個協同過濾的簡單例子,看一下 Mahout給我們提供的強大的協同過濾算法。需要新建一個基於Maven的工程,下面是 pom.xml需要導入的包。 1 2

原创 相關數據挖掘算法的調用

 分類算法:       1.調用C4.5         分類算法我們會額外計算它的分類準確率,實現代碼如下,有註釋了,分類算法的實現很多共通之處,往後的幾個 分類算法就不指明瞭:         必須提醒的是,設置分類屬

原创 Mahout使用入門

一、簡介 Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。Apache Mahout項目已

原创 在eclipse下使用java調用weka

weka是很好用的機器學習庫,這裏就不詳細介紹了。 言歸正傳,要使用程序方式使用weka,步驟如下: 一、在eclipse裏新建一個java project: 1.      建立工程:單擊菜單中file->new->java proje

原创 在 Ubuntu12.04 上安裝Hadoop-1.2.1 (講解的非常詳細)

在 Ubuntu12.04 上安裝Hadoop-1.2.1 (講解的非常詳細) 實踐環境 : Ubuntu12.04+jdk1.7.0_55+hadoop-1.2.1 (兩臺虛擬機master和slave1) 機器名        IP 

原创 用WEKA對於數據挖掘時相關算法的介紹和使用方法

數據格式編輯 跟很多電子表格或數據分析軟件一樣,WEKA所處理的數據集是一個二維的表格。 這裏我們要介紹一下WEKA中的術語。表格裏的一個橫行稱作一個實例(Instance),相當於統計學中的一個樣本,或者數據庫中的一條記錄。 豎行

原创 在 Ubuntu 上安裝Hadoop 教程

在 Ubuntu 上安裝Hadoop 教程實踐環境 :U buntu8.04+jdk1.6+hadoop-0.20.1( 三臺實體機 )機器名    

原创 Linux操作常用命令學習總結

Linux操作命令:http://linux.chinaitlab.com/special/linuxcom/ 一、常用的Linux命令 切換用戶:su 修改密碼:passwd 清除屏幕:clear 關閉系統:shutdown -hy 0

原创 Ubuntu虛擬機搭建HDFS時常遇到的問題及相關解決辦法

Ubuntu虛擬機搭建HDFS時常遇到的問題及相關解決辦法 我通關學習搭建hadoop節點集羣時,遇到的各種問題有一個簡短的總結。相信這會是很多跟我一樣,剛剛接觸或者學習hadoop的朋友們會在學習的過程中經常碰到的問題。希望一下的總結能

原创 基於Mahout的電影推薦系統

1 Mahout介紹 Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。經典算

原创 R編輯器Rstudio學習筆記——基本功能與操作

爲了爲參加supstat夏令營,今天特地熟悉了和R語言配套的編輯器Rstudio。以前只聞其聲,未見其貌,今天試用一下,發現界面簡單清晰,既能幫助初學者熟悉函數,也能對複雜的程序結構進行優化,方便閱讀。 Rstudio界面如下所示,簡單地

原创 39個讓你受益的HTML5教程

閒話少說,本文作者爲大家收集了網上學習HTML5的資源,期望它們可以幫助大家更好地學習HTML5. 好人啊! 不過,作者原來說的40個只有39個,因爲第5個和第8個是重複的。 1. 五分鐘入門HTML5 (Learn HTML5

原创 Mahout 協同過濾 itemBase RecommenderJob源碼分析

Mahout支持2種 M/R 的jobs實現itemBase的協同過濾  I.ItemSimilarityJob  II.RecommenderJob  下面我們對RecommenderJob進行分析,版本是mahout-dist

原创 七款代碼味道識別工具【簡介】

代碼味道識別工具 (Code Smell Detection Tools, CSDT)既可以應用於軟件開發階段,也可以應用於軟件維護階段。目前大部分IDE都集成了自動或者半自動重構工具,但是根據國外研究人員的調查發現,真正在軟件開發和維護

原创 在Hadoop分佈式集羣環境下Mahout安裝和運行K-means、協同過濾實例

在Hadoop分佈式集羣環境下Mahout安裝和運行Kmean、協同過濾實例   友情提醒:大家最好通讀一遍過後,在理解的基礎上按照步驟一步一步設置,因爲後面的會對前面的有所啓示。 注意:mahout運行對於環境要求很嚴格,JDK:jdk