原创 Flume常見面試題

一、Flume 組成、Put 事務、Take 事務 Taildir Source:斷點續傳、多目錄。Flume1.6 以前需要自己自定義 Source 記錄每次讀取文件位置,實現斷點續傳。 File Channel:數據存儲在磁盤

原创 大數據開發筆試題(二)

1、關於 java 的異常處理機制,以下說法正確的是:A A、當某個線程拋出 OutofMemoryError 時,其他線程可能不受影響 B、當大量拋出 RuntimeException,不會影響系統的吞吐量 C、java.lan

原创 hive中over函數講解

https://blog.csdn.net/qq_22222499/article/details/92406370

原创 LeetCode算法 -- 反轉鏈表(第5題)

一、題目描述 二、編寫代碼 2.1 編寫一個 ListNode 類 package question5; /** * @description: 鏈表的節點類 * @author: hyr * @time: 2020/3

原创 kafka 集羣啓動失敗:FATAL [KafkaServer id=0] Fatal error during KafkaServer startup.

文章轉載至:https://blog.csdn.net/Hello_World_QWP/article/details/79419532

原创 LeetCode算法 -- 螺旋矩陣(第3題)

一、題目說明 二、求解思路 螺旋矩陣,它是要順時針遍歷,先遍歷外層,再遍歷內層。 現在有一個矩陣爲: 1 2 3 4 5 6 7 8 9 首先我們輸出第一行,然後向下改變方向,繼續輸出,當我們輸出完第一行後的矩陣爲: 4 5 6

原创 hive常見面試題

一、Hive 的架構 二、Hive和數據庫比較 Hive 和數據庫除了擁有類似的查詢語言,再無類似之處。 1、數據存儲位置 Hive 存儲在 HDFS 。數據庫將數據保存在塊設備或者本地文件系統中。 2、數據更新 Hive 中不

原创 大數據開發筆試題(一)

1、Oracle 中下列哪個表達式值爲 true?(D) A、null = null B、’’ = null C、0 = null D、以上三個都不爲 true 2、Oracle 支持的表分區類型爲?(ABD) A、List B、

原创 Hive 解決數據傾斜的方法

文章一: https://www.cnblogs.com/raymoc/p/5325295.html 文章二: https://www.jianshu.com/p/daa4e7c86925

原创 sqoop 面試題

原创 hive 中 hql 題

問題 1: (1) 需求 找出所有科目成績都大於某一學科平均成績的學生。 (2) 建表 drop table if exists score; create table score( uid string,

原创 LeetCode算法 -- LRU緩存機制(第11題)

一、題目描述 二、分析題目 2.1 LRU 算法介紹 計算機的緩存容量有限,如果緩存滿了就要刪除一些內容,給新內容騰位置。但問題是,刪除哪些內容呢?我們肯定希望刪掉哪些沒什麼用的緩存,而把有用的數據繼續留在緩存裏,方便之後繼續使

原创 二叉樹的前中後遍歷(遞歸和非遞歸)

一、三種遍歷的思想 前序遍歷:根結點 -> 左子樹 -> 右子樹 中序遍歷:左子樹 -> 根結點 -> 右子樹 後序遍歷:左子樹 -> 右子樹 -> 根結點 以下面這棵二叉樹,三種遍歷的結果分別爲: 前序遍歷:1 2 4 5 7

原创 LeetCode算法 -- 合併兩個有序數組(第9題)

一、題目介紹 二、數組拷貝解法 2.1 解法介紹 因爲數組 1 的總長度是大於等於 m+n 的,所以把數組 2 的元素都拷貝到數組1中。數組 1 中的元素有 m 個,所以數組 2 中的第一個元素拷貝到數組 1 中對應的下標就是m