原创 hadoop中的trash機制,恢復刪除的文件

Hadoop回收站trash,默認是關閉的。 1.修改conf/core-site.xml,增加 Xml代碼 <property>   <name>fs.trash.interval</name>   <value>1440</value

原创 hbase運維

轉自:http://blog.bluedavy.com/?p=251 NoSQL現在風生水起,hbase的使用也越來越廣,但目前幾乎所有的NoSQL產品在運維上都沒法和DB相提並論,在這篇blog中來總結下我們在運維hbase時的一些問題

原创 各版本編譯hadoop eclipse plugin

轉自:http://www.gemini5201314.net/hadoop/%E5%90%84%E7%89%88%E6%9C%AC%E7%BC%96%E8%AF%91hadoop-eclipse-plugin.html 最近一直在使用m

原创 linux分割大文件(tar + split) 使用分卷打包

在Linux下使用 tar 命令來將文件打包並壓縮是很通常的用法了。可是Linux的文件系統對文件大小有限制,也就是說一個文件最大不能超過2G,如果壓縮包的的內容很大,最後的結果就會超過2G,那麼該怎麼辦呢?又或者壓縮包希望通過光盤來進行

原创 Hadoop 和DBMS 的互補性

隨着Microsoft 也加入Hadoop 陣營,Hadoop 已經完全變成了DBMS 的好朋友了 , 2年之前的SIGMOD組織提出的“A Comparison of Approaches to Large-Scale Data Ana

原创 hadoop命令加載包的順序

這幾天在搞hadoop的一個基礎包,過程中搞的很頭大,明明用-libjars傳了,在job提交前總是提示出錯,新修改的函數執行出錯。不過最後還是解決了,這要從hadoop本身加載包裏函數的順序說起。 hadoop命令執行時,本地執行時(沒

原创 Hadoop命令大全

轉自:http://blog.csdn.net/wf1982/article/details/6215545 1、列出所有Hadoop Shell支持的命令  $ bin/hadoop fs -help2、顯示關於某個命令的詳細信息  $

原创 hive實戰

本文轉自:http://www.cnblogs.com/xuqiang/archive/2011/06/15/2081796.html   1. 安裝hive 2. hive實戰 3. hive存儲模型 4. 深入hql查詢語言 5.

原创 Eclipse插件FatJar安裝與使用

Eclipse插件fatjar打包項目,可以把需要的資源打進一個jar裏。所以下載了一個,下載地址:http://sourceforge.net/project/showfiles.php?group_id=115990&package_

原创 Apache Commons工具集簡介

轉自:http://java.chinaitlab.com/base/859067.html   Apache Commons包含了很多開源的工具,用於解決平時編程經常會遇到的問題,減少重複勞動。我選了一些比較常用的項目做簡單介紹。文中用

原创 Jackson 框架,輕易轉換JSON

Jackson 框架,輕易轉換JSON http://www.cnblogs.com/hoojo/archive/2011/04/22/2024628.html 點贊 收藏 分享 文章舉報

原创 Apache Mahout的Taste基於Hadoop實現協同過濾推薦引擎的代碼分析

轉自:http://hi.baidu.com/dmuyy/blog/item/2a0090e73c434334b83820fd.html   Taste 是 Apache Mahout 提供的一個協同過濾算法的高效實現,它是一個基

原创 hadoop常見錯誤

錯誤1:bin/hadoop dfs 不能正常啓動,持續提示:INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000. Already tried 0

原创 hadoop jar xxxx.jar的流程

轉自:http://hi.baidu.com/dtzw/blog/item/64a6f3f2dff0511eb17ec5b0.html 搞清楚 hadoop jar xxxx.jar 執行的流程: jar文件是如何分發的JobClient

原创 Hadoop 中的兩表join

轉自:http://www.gemini5201314.net/hadoop/hadoop-%e4%b8%ad%e7%9a%84%e4%b8%a4%e8%a1%a8join.html   作爲數據分析中經常進行的join 操作,傳統DBM