原创 Ubuntu下hadoop的集羣式分佈配置

    JDK 6u45     Hadoop 0.20.203.0 首先,保證要徵用的幾臺電腦在同一個網域內(即IPv4的前三個數字是一樣的),建議適用靜態IP以免每次啓動更改hosts文件:     Master:192.168.1

原创 HBase 默認配置說明

hbase.rootdir 這個目錄是region  server的共享目錄,用來持久化Hbase。URL需要是'完全正確'的,還要包含文件系統的scheme。例如,要表示hdfs中的 '/hbase'目錄,namenode  運行在na

原创 幾個簡單的HBase的Java程序(待續)

請先創建一張表,命令如下: create 'testtable','colfam1' 然後在執行下面程序(在eclipse上執行就直接是run as java application): 1、向表中加入數據: package hba

原创 Hadoop的多文件輸出及自定義文件名

    最近寫程序的時候要用到多文件輸出。但是在網上找了很多資料,要麼是老版本的方法,要麼就是新版本的方法。網上很多說0.20.203.0版本的Hadoop中有MultipleOutputs類——確實有,只不過是老版的。坑啊。而他們用的

原创 Ubuntu上安裝Hadoop僞分佈

JDK版本:jdk-6u45-linux-x64.bin (下載網址:http://www.oracle.com/technetwork/java/javase/downloads/index.html,請到Previous Re

原创 Ubuntu14.04LTS上安裝fcitx輸入法

    我的Ubutnu版本是14.04LTS,也就是最近才發佈的版本,但下的是英文版的,沒有中文輸入法(其實有個ibus,但用着太不方便,安裝了半天還是用不了),最後發現了這個fcitx輸入法,而且這個輸入法還是中國人編的,那當然支持

原创 Ubuntu上HBase僞分佈的配置

HBase版本:0.90.4 Hadoop版本:0.20.203.0 JDK版本:1.6 確保Hadoop已經安裝好,不會的請參照下面鏈接:http://blog.csdn.net/invincible7/article/details/

原创 hive與hbase的十大區別與聯繫

共同點: 1.hbase與hive都是架構在hadoop之上的。都是用hadoop作爲底層存儲   區別: 2.Hive是建立在Hadoop之上爲了減少MapReducejobs編寫工作的批處理系統,HBase是爲了支持彌補Hadoop對

原创 Hadoop的整文件讀取

    寫Hadoop程序時,有時候需要讀取整個文件,而不是分片讀取,但默認的爲分片讀取,所以,只有編寫自己的整文件讀取類。 需要編寫的有:     WholeInputFormat類,繼承自FileInputFormat類   

原创 hadoop中的一些基本操作及wordcount的運行操作示範

一、HDFS常用操作        先粗略說一下“hadoop fs”和“hadoop dfs”的區別:fs是各比較抽象的層面,在分佈式環境中,fs就是dfs,但在本地環境中,fs是local file system,這個時候dfs不可

原创 修改 ubuntu 默認啓動項

      安裝Ubuntu和Windows雙系統後,每次啓動都要按下箭頭才能進入Windows,如果一疏忽,又得重啓一次,頗爲麻煩。有沒有什麼辦法讓系統啓動時自動進入Windows呢?最近在網上搜索了一篇,在這裏轉載給大家分享一下(原文