原创 談笑間學會大數據-Hive中的分桶表
談笑間學會大數據-Hive中的分桶表 你可以不夠優秀,但是不要甘於平凡 Hive中的分桶表 官方文檔 首先我們可以參考下官方文檔,對於創建分桶表的一些描述 https://cwiki.apache.org/confluence
原创 算法③:構建乘積數組
算法③:構建乘積數組 題目鏈接:https://leetcode-cn.com/problems/gou-jian-cheng-ji-shu-zu-lcof/ 題目要求: 給定一個數組 A[0,1,…,n-1],請構建
原创 談笑間學會大數據-Hive命令
Hive命令 目錄 Hive命令 前言 變量和屬性 Hive中“一次使用”命令 執行文件中的SQL 如何在hive cli中執行shell命令或訪問hdfs呢? hiverc文件 hive cli 小技巧 自動補全命令 查看執行命令歷史
原创 談笑間學會大數據-Hive函數
談笑間學會大數據-Hive函數 用戶自定義函數(UDF)是一個允許用戶擴展HiveQL的強大的功能。正如我們將看到的,用戶使用Java進行編碼。一旦將用戶自定義函數加入到用戶會話中(交互式的或者通過腳本執行的),它們就將和內
原创 談笑間學會大數據-Hive中的排序
你可以不夠優秀,但是不要甘於平凡。-- 阿尼古 Hive中的四種排序 order by 、 sort by 、 distribute by 、cluster by 首先貼一下官網對於Hive排序的幾種方法的介紹: https:
原创 談笑間學會大數據-Hive查詢SQL
Hive查詢SQL 目錄 Hive查詢SQL 使用正則表達式來指定列 算術運算符 使用函數 數學函數 聚合函數 表生產函數 其他內置函數列表如下 什麼情況下會避免進行MapReduce 謂詞操作符 關於浮點數比較 Like和Rlike
原创 談笑間學會大數據-MapReduce作業運行全流程
MapReduce作業運行流程 keywords Yarn、ResourceManager 、 ApplicationManager + Resource Schedule 、Container 一個job運行的整體流程 Yarn
原创 hadoop格式化namenode後導致datanode無法啓動
hadoop格式化namenode後導致datanode無法啓動 首先貼報錯哈,錯誤不一樣,就不用往下看了。。。 報錯截圖 錯誤分析 Failed to add storage directory [DISK]file:/Users/
原创 算法題②:不用加減乘除做加法
題扣面試題:面試題65. 不用加減乘除做加法 題目鏈接:https://leetcode-cn.com/problems/bu-yong-jia-jian-cheng-chu-zuo-jia-fa-lcof/ 題目要求:
原创 算法題①:求1+2+…+n
題扣面試題:面試題64. 求1+2+…+n 題目鏈接:https://leetcode-cn.com/problems/qiu-12n-lcof/ 題目要求: 求 1+2+...+n ,要求不能使用乘除法、for、wh
原创 談笑間學會大數據-Hive索引
談笑間學會大數據-Hive索引 Hive 只有有限的索引功能。Hive中沒有普通關係型數據庫中鍵的概念,但是還是可以對一些字段建立索引來加速某些操作的。一張表的索引數據存儲在另外一張表中。 同時,因爲這是一個相對比較新
原创 Hive使用正則表達式模糊匹配列報錯
報錯信息:Invalid table alias or column reference ‘name.*’ hive> select * from test_stu_3 > ; OK 張三 張三 12 李四 李四 10 w
原创 面試題① - java 反射機制
java 反射原理 1、反射機制的概念: 1.1、指在運行狀態中 對於任意一個類,都能夠知道這個類的所有屬性和方法, 對於任意一個對象,都能調用它的任意一個方法. 這種動態獲取信息,以及動態調用對象方法的功能叫java
原创 談笑間學會大數據-Hive安裝部署及組件架構
Hive安裝部署及組件架構 Hive安裝部署 首先貼出hive官網地址:http://hive.apache.org/ 任何一個框架或者組件學習的時候都需要去參考一下官方文檔,因爲這個是學習這個組件的一種方式,大部分通過看書、看博客來進
原创 datax 中Transformer的使用
datax中的Transformer的使用 建議看一下datax的源碼哦!其實沒有我們想象的那麼複雜... 官網上也有些示例代碼的。請看地址:https://github.com/alibaba/DataX/t