原创 別怕,遇到Map源碼面試題這樣答就對了

衆所周知,在面試大廠的過程中,HashMap源碼是必問的,當然有些還會問TreeMap 和 LinkedHashMap。如果事先沒有準備,當然會瞬間懵逼,因此在面試前建議大家抽出時間準備準備,很容易就能續寫自己的高光時刻。 在開

原创 紅黑樹動圖解析

紅黑樹動圖解析 一、啥是紅黑樹? 紅黑樹(Red Black Tree) 是一種自平衡二叉查找樹,是在計算機科學中用到的一種數據結構,典型的用途是實現關聯數組。因此想要弄清楚紅黑樹,我們需要先解決幾個問題: 二叉查找樹是什麼?

原创 hive面試題總結(2020最新版)

本文目錄一、hive架構相關二、hive的特點三、內部表和外部表的區別?四、4個by的區別?五、介紹一下有哪些常用函數?5.1、行轉列函數5.2、列轉行函數5.3、Rank排名函數5.4、窗口函數(開窗函數)六、UDF、UDAF、

原创 深入分析HDFS原理及讀寫流程

本文目錄一、架構體系1.1、什麼是HDFS?1.2、組成HDFS的各模塊作用1.2.1、Client1.2.2、NameNode1.2.3、DataNode1.2.4、SecondaryNameNode二、數據讀寫2.1、讀數據2

原创 最清晰易懂的Elasticsearch操作手冊|收藏夾必備

寫在前面:我是「且聽風吟」,目前是一名大數據開發工程師,熱愛大數據開源技術,喜歡分享自己的所學所悟,現階段正在從頭梳理大數據體系的知識,以後將會把時間重點放在Spark和Flink上面。 如果你也對大數據感興趣,希望在這個行業

原创 深入分析零拷貝的原理,徹底掌握Netty、Kafka、RocketMQ高效率讀寫的祕訣

文章目錄一、前言二、糾正一些網絡上流傳的錯誤說法2.1、錯誤說法一:零拷貝就是零複製或者零拷貝技術沒有進行數據的複製操作,所以比較快。2.2、錯誤說法二:DMA技術誕生後,零拷貝基於DMA,實現了絕對的零複製......三、並不神

原创 大數據面試題知識點分析(十二)之Kafka面試真題及答案

已經2020年了,kafka可以說是必知必會的了,首先面試大數據崗位的時候必問kafka,甚至現在java開發崗位也會問到kafka一些消息隊列相關的知識點。下面就根據最新的Kafka相關面試點總結最準確的答案如下: 本文目錄一、

原创 一文徹底學會hive分桶表(實戰詳解)

本文目錄一、分桶表概述1.1、什麼是分桶表?1.2、分桶表和分區表有啥區別?二、分桶表實戰2.1、創建一個分桶表2.2、準備數據2.3、向分桶表導入數據2.3.1、錯誤導入示範(引出分桶的本質)2.3.2、正確導入示範(引出分桶規

原创 深入分析hadoop之YARN原理、架構、作業流程及調度器

本文目錄一、YARN的原理1.1、yarn是什麼?1.2、yarn解決了什麼問題?二、架構設計詳解2.1、ResourceManager(簡稱RM)2.1.1、調度器(Scheduler)2.1.1、應用程序管理(Applicat

原创 大數據面試題知識點分析(十一)之Flume面試真題及答案

一般情況下面試大數據崗位的時候都會問到flume,我們之前也對flume進行過總結,不過時間太快了,轉眼到了2020年。下面根據本人最新的flume相關面試並總結最準確的答案如下: 本文目錄一、Flume的Source,Sink,

原创 深入分析zookeeper(理論加實戰)

本文目錄一、zookeeper基礎1.1、什麼是zookeeper?1.2、文件系統1.2、監聽通知機制二、實際生產中的作用2.1、配置管理2.2、統一命名服務2.3、分佈式鎖2.4、集羣管理等服務三、紙上得來總覺淺,zookee

原创 深入分析Kafka架構(一):工作流程、存儲機制、分區策略

本文目錄一、前言二、kafka工作流程二、文件存儲機制2.1、文件存儲結構及命名規則2.2、文件關係2.3、使用offset查找message三、分區策略3.1、爲什麼要進行分區3.2、分區策略 一、前言 在開始之前首先要明確一點

原创 0、展望---Flink 1.9版本變化及新特性

一、背景及概覽 阿里內部版本Blink首次合併入Flink,並於2019年8月22日,正式發佈Apache Flink 1.9.0 版本。 Flink1.9版本變化官方文檔 更新概述: 架構升級 新功能和改進 細粒度批作業恢

原创 ElasticSearch中文分詞,看這一篇就夠了

寫在前面:我是「且聽風吟」,目前是某上市遊戲公司的大數據開發工程師,熱愛大數據開源技術,喜歡分享自己的所學所悟,現階段正在從頭梳理大數據體系的知識,以後將會把時間重點放在Spark和Flink上面。 如果你也對大數據感興趣,希

原创 中華石杉學習整理

本文已更新,各位及時保存,防止下次失效。 最近公司事情比較多,可能沒辦法及時回覆各位,希望大家發揚咱中國人互幫互助的精神,給同爲程序員的兄弟們分享自己的資料,促進彼此的進步! ps:所有的鏈接,如果大家發現是收費的,都不要去付費,這些資料