原创 Linux-權限管理-chattr與lsattr命令

原地址 PS:有時候你發現用root權限都不能修改某個文件,大部分原因是曾經用chattr命令鎖定該文件了。chattr命令的作用很大,其中一些功能是由Linux內核版本來支持的,不過現在生產絕大部分跑的linux系統都是2.6以上內

原创 mahout學習(二)--基於Mahout的電影推薦系統

1 Mahout介紹 Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。

原创 CentOS install Python 2.7.6 and 3.3.3

How To Set Up Python 2.7.6 and 3.3.3 on CentOS 6.4 Introduction More often than not, as a developer you will be res

原创 hadoop學習--MapReduce初級案例

MapReduce初級案例--蝦皮的博客

原创 rstudio-server使用github版本控制

詳見:多人在線開發R 知乎git學習建議 gitpro (1)git安裝 方法一 源碼安裝 //先安裝git依賴的包  yum install zlib-devel  yum install openssl-devel  yum ins

原创 hadoop學習--HDFS

HDFS初探之旅--蝦皮的博客

原创 mahout學習(一)--安裝配置+入門示例

Mahout安裝與配置 Mahout是Hadoop的一種高級應用。運行Mahout需要提前安裝好Hadoop。Hadoop的安裝網上很多,並不複雜,這裏不再講述,接下來闡述怎麼安裝Mahout。 在Mahout實現的機器學習算

原创 ggplot2實現多圖合併

multiple plots in one page cookbook-R-multiplot # Multiple plot function # # ggplot objects can be passed in ..., or

原创 Linux-權限管理-su與sudo詳解

    概要:在linux上進行有關權限的操作時,往往會碰到這樣的問題: 1)爲什麼安裝軟件需要在apt-get之前加上sudo?剛剛安裝完畢,再次運行apt-get卻不需要再在前面加sudo? 2)爲何有時運行sudo comma

原创 使用R畫桑基圖(流程圖)

桑基圖可以用來表示各個節點之間轉換 在R中可以直接定義點點之間的關係後使用相應的package畫桑基圖: 方法一: riverplot library(riverplot) # 構造連接節點的數據框 edges = data.fra

原创 git

Git客戶端圖文詳解如何安裝配置GitHub操作流程攻略 Git版本控制軟件結合GitHub從入門到精通常用命令學習手冊

原创 centos 6.5 安裝配置R問題記錄

R畫圖中文亂碼 出現麻將字樣的亂碼可能是由於字體設置引起 $vi /etc/sysconfig/i18n LANG="zh_CN.UTF-8" SUPPORTED="zh_CN.GB18030:zh_CN:zh:zh_CN.GB2312:

原创 hadoop學習--hive

(1)hive的安裝配置1 Hive安裝配置1 (2)hive的安裝配置2 Hive安裝配置2 (3)hive運行報錯java.lang.RuntimeException: java.lang.IllegalArgumentExc

原创 R調用BaiDu地圖API

由於ggmap不能正常使用 考慮使用R調用百度地圖的API R中調用地圖接口的方法 在R中本來可以直接使用Google地圖對應的包RgoogleMaps;ggmap 參考: http://cran.r-project.org/web

原创 dplyr分組後返回多值的處理

(1)dplyr包使用do來處理分組彙總函數返回多值的問題 (2)lapply函數與dplyr的效率比較 lapply函數使用之前需要對原始數據拆分爲list的結構(使用split函數),而拆分的過程當數據量稍大時速度很慢 # 計算分組