原创 Hive優化(整理)

本文檔是參考多個博客以及Hadoop2.5.0和Hive0.13.1的配置文件及源碼整理出來的,未做詳細解釋的部分可以在文章尾查看參考文檔 一、硬件優化 1、配置 二、網絡優化 1、交換機 ⑴普通交換機:網線連接服務器,便宜

原创 Hadoop-2.4.1學習之如何確定Mapper數量

       MapReduce框架的優勢是可以在集羣中並行運行mapper和reducer任務,那如何確定mapper和reducer的數量呢,或者說如何以編程的方式控製作業啓動的mapper和reducer數量呢?在《Hadoop-

原创 HBase異常類型

源文檔鏈接:http://hbase.apache.org/apidocs/org/apache/hadoop/hbase/package-summary.html 接口概要  Interface 說明 Cell

原创 FusionInsight HD HBase 常用API

FusionInsight HD 2.6

原创 Spark的異常(一)

在同一臺機器上同時啓動本地模式和集羣模式出現如下錯誤: ERROR Datastore.Schema: Failed initialising database. Failed to start database 'metastore_d

原创 HBase的異常(一)

hbase(main):001:0> list TABLE

原创 Scala之變量與函數

Scala 官網:http://www.scala-lang.org/ 一、數據類型 二、變量 /* * 變量的定義 * 語法: * 關鍵字(val / var) 變量名:數據類型(首字母大寫):值 * 特點: * ⑴S

原创 Hive的異常(一)

Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.had

原创 Hive是什麼,Hive與關係型數據庫的區別

Hive是什麼,Hive與關係型數據庫的區別? ⑴Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射成一張表,並提供類sql語句的查詢功能; Hive使用Hql作爲查詢接口,使用HDFS存儲,使用mapreduce

原创 MapReduce自帶wordcount的實現

package com.bruce.mapreduce; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.c

原创 FusionInsight HD常見異常

1、認證異常 未完待續。。。。

原创 HBase的異常(二)

ERROR: org.apache.hadoop.hbase.TableNotDisabledException: event_logs at org.apache.hadoop.hbase.master.HMaster.checkTa

原创 Hive中管理表(內部表)和外部表的區別是什麼,及分區表使用場景

Hive中管理表(內部表)和外部表的區別是什麼,及分區表使用場景? ⑴區別: ①Hive創建內部表時(默認創建內部表),會將數據移動到數據倉庫指向的路徑;創建外部表(需要加關鍵字external),僅記錄數據所在的路徑,不對數據的位置做