台部落Wflowerd

GROUPING SETS：根據不同的維度組合進行聚合，等價於將不同維度的GROUP BY結果集進行UNION ALL GROUPING__ID：表示結果屬於哪一個分組集合，屬於虛字段 CUBE：根據GROUP BY的維度的

2018-11-04 00:24:17

1) clean,compile,build,package,install等應用編譯打包的參數。 2) 四個主要組成：我是誰、我的依賴倉庫源、我依賴誰、如何構建 3) 鏡像:mirror，核心作用：加速依賴包的下載中央倉

2018-10-13 00:10:21

this關鍵字有三個主要的作用： 1、在構造方法中調用其他構造方法。比如有一個Person類，有三個構造方法，某一個構造函數中調用另外構造方法，就要用到this，而直接使用Person()是不可以的。 2、返回當前對象的引用 3、區分成

2018-10-13 00:10:21

1) sqoop 第三方工具包(插件plugin),實現的是hive(非關係型數據源)與關係型數據庫相互傳輸數據的最常用組件。其它的如datax是類似的插件。 2) 自行實現 A: hive, B:

2018-10-10 00:13:08

首先查看unzip下的各個參數的用法 -u 更新文件，意爲若文件存在則不會創建新的文件、 -o 重寫文件，無條件創建新的文件 -d 將產生的文件輸出將列表內的兩個.zip文件一同解壓並將解壓後的文件放入新的文件夾下-u

2018-10-06 05:06:22

1.首先查看mysqld的服務狀態若沒有開啓，則啓動mysql服務：service mysqld start2.默認mysql無密碼，需設置root用戶密碼登錄mysql服務器：mysql -u root //直接回車進入mys

2018-08-27 12:31:27

HDFS解決底層的存儲問題yarn解決資源調度和任務管理。（資源調度：有了任務後，決定分配到哪些機器上執行；任務管理：任務在執行過程中，進行過程監控、狀態反饋、再調度等工作）MapReduce,解決分佈式計算門檻高問題，基於其框架對分佈式

2018-08-27 12:31:24

1.git工作原理.git是什麼開源的分佈式版本控制系統，去中心化。大小項目均可以靈活管理，參與開發人員比較靈活。Linux的代碼管理工具BitKeeper不適合開源社區，故Torvalds推出了GIT。.工作架構.工作流程圖.分支管理

2018-08-27 12:31:24

Hive是基於Hadoop的數據倉庫，使用HQL作爲查詢接口、HDFS作爲存儲底層、mapReduce作爲執行層，基於Hadoop平臺解決了企業數據倉庫構建的核心技術問題，證明了Hadoop平臺的強大。從而進一步降低了Hadoop使用的

2018-08-27 12:31:24

例如：運行字符串函數CHAR_LENGTH(s) : 求字符串的長度，每個字符計數爲1，只看字符個數，不看字符所佔的字節數如果你的結果集不是2，而是>2的結果，其原因在於mysql的字符集設置保持了默認的latin1，使其不識別中文導致，

2018-08-27 12:31:24

.文件格式文件格式按面向的存儲形式不同，分爲面向行和麪向列兩大類文件格式。面向行、列類型類型名稱是否可切割計算優點缺點適用場景面向行文本文件（.txt)YES查看編輯簡單無壓縮佔空間大，傳輸壓力大，數據解析開銷大學習練習使用面向行Seq

2018-08-27 12:31:24

數據庫設計範式關係數據庫中的關係必須滿足一定的要求，即滿足不同的範式。關係數據庫有六種範式：第一範式（1NF）、第二範式（2NF）、第三範式（3NF）、巴德斯科範式（BCNF）、第四範式（4NF）和第五範式

2018-08-27 12:31:24

安裝用於linux與window之間互相傳遞文件的rzsz命令：yum install lrzsz安裝成功後，執行rzrz 文件路徑 //從本地上傳數據sz 文件路徑 //從遠程發送數據到本地

2018-08-27 12:31:24

import java.io.ByteArrayOutputStream; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataIn

2018-08-27 12:31:24

獲取本地文件工具類import java.io.*; public class GetLocalFile { public static String getLocalFile(String filePath) throws E

2018-08-27 12:31:24