原创 【Hive】Hive高級聚合(grouping sets、rollup、cube)

Hive高級聚合(0.10開始支持) 高級聚合功能相當於group by 加強 grouping sets:多個group by 進行union all,在同一個數據集進行多重group by       該關鍵字可以實現同一數據集的多重

原创 【Hive】HiveServer & HiveServer2 對比

HiveServer1的限制:用戶併發性(不能處理多餘一個客戶端的併發請求)、LDAP安全性、訪問限制 HiveServer2在Hive1.1引入(HIVE-2935),提供更好的併發性、安全性、遠程訪問   HiveServer2

原创 【Lambda】Lambda表達式

基本語法:   (parameters) -> expression  或  (parameters) ->{ statements;} String[] atp = {"Rafael Nadal", "Novak Djokovic",

原创 【Hive】Hive數據傾斜

數據傾斜: hive在跑數據時經常會出現數據傾斜的情況,使的作業經常reduce完成在99%後一直卡住,最後的1%花了幾個小時都沒跑完,這種情況就很可能是數據傾斜的原因,解決方法要根據具體情況來選擇具體的方案   (1)key值發生傾斜,

原创 【問題】Intellij 搜索全局快捷鍵失效解決辦法

在使用Intellij IDEA時,使用ctrl +  shift + F 全局搜索時,由於輸入法干擾導致失效。 更改以下配置即可:  

原创 【Shell】grep sed awk

grep [options]  PATTERN -i:忽略大小寫 --color:匹配到的字符用其他顏色顯示出來 -v:顯示沒有匹配到的行 -o:只顯示被模式匹配到的字符串,不顯示行 -A n:顯示該行及其後n行 -B n:顯示該行及其前

原创 Scala學習梳理

第1章  概述 Scala是一個編譯型的靜態類型語言 Scala REPL:Read(讀)、Evaluate(執行)、Print(打印)、Loop(循環) 第2章  處理數據:字面量、值、變量和類型 Scala編譯器將從賦值判斷這個值

原创 【Hive】《Hive編程指南》梳理

轉載請註明出處 第1章  基礎知識 Hive不支持事務(標註:低版本不支持,高版本ACID支持) Hive不支持OLTP(聯機事務處理)所需要的關鍵功能,而更接近成爲一個OLAP(聯機分析技術)工具。 MapReduce是一種計算模型,

原创 【錯誤處理】Java之替換“\n”符號

在去除字符串中的換行符(\n)的時候,寫成str.replace("\\n", "")才能正確執行。 str.replace("\n","") ,str.replaceAll("\\n",""),str.replaceAll("\n","

原创 Hive與數據庫的區別

  區別點 Hive 傳統數據庫 SQL SQL-92標準   數據存儲位置 數據存儲在Hdfs中 保存在塊設備或本地文件系統 數據讀取 讀時模式:加載數據不會驗證 寫時模式:數據寫入時檢查

原创 【補坑】Java自動裝箱的原因

要考慮兩點原因: (1)Java中原始變量包含的值可能具有不同的長度(例如:float、double) 原始變量不能以相同的方式互換,也不能彼此互換,也不能互換Object(例如 String Object)   (2)泛型擦除 了避免對

原创 【錯誤處理】git-am is in progress

git-am的用法: git-am 可以一次合併一個文件,或者一個目錄下所有的patch 參考:https://blog.csdn.net/mliubing2532/article/details/7577905   git pull 的

原创 【Hive】Inspector

ObjectInspector幫助我們研究複雜對象的內部結構,解耦了數據使用和數據格式,從而提高了代碼的複用度。 一個ObjectInspector實例代表了一個類型的數據在內存中存儲的特定類型和方法。   一個ObjectInspect

原创 Guava工具包使用

Guava工具包含了若干被Google的 Java項目廣泛依賴 的核心庫,例如: 集合 [collections] 緩存 [caching] 原生類型支持 [primitives support] 併發庫 [concurrency lib

原创 【問題】Maven本地存在jar包,但是編譯不過(Could not find artifact...)

報錯信息: Could not find artifact com.xxxxx in artifactory-maven-remote  原因是因爲包含下載未成功的文件(.lastUpdated),遠程倉庫配置信息(_remote.r