原创 6 Spark分區

原创 7 SparkSQL

原创 4 內存模型

原创 2 運行流程

原创 3 調優

 

原创 1 RDD

https://www.cnblogs.com/qingyunzong/category/1202252.html 

原创 5 資源調優

原创 1 初識hadoop

原创 6 Zookeeper應用

目錄 1典型應用及實現 1.1數據發佈訂閱 1.2負載均衡 1.3命名服務 1.4分佈式協調/通知 1.5集羣管理 1.6Master選舉 1.7分佈式鎖 共享鎖 羊羣效應 2在大型分佈式系統中的應用 2.1Hadoop 2.2Kafka

原创 1緒論

1基本術語 分類&迴歸 泛化 2NFL定理 https://www.jianshu.com/p/e1705306f6a3      

原创 17 Hive

目錄 2示例 3運行Hive 3.1配置 4Hive與傳統數據庫對比 4.1讀時模式vs寫時模式 4.2更新、事務和索引 5HiveQL 5.1數據類型 5.2操作與函數 6表 6.1 託管表和外部表 6.2 分區和桶 6.3存儲格式 6

原创 7-4~9技術內幕

  目錄 1會話​ 2服務器啓動 3leader選舉  4各服務器角色介紹 5服務端請求處理 6數據與存儲 1會話 2服務器啓動 3leader選舉  4各服務器角色介紹 5服務端請求處理 6數據與存儲

原创 7-2&3 技術內幕-序列化與協議&客戶端

目錄 1序列化協議 1.2步驟 1.3深入Jute 1.4通信協議 1.4.1協議解析:請求部分 1.4.2協議解析:響應部分 2客戶端 2.1一次會話的創建過程 2.1.1初始化階段 2.1.2會話創建階段 2.1.3響應處理階段 2.

原创 3 YARN

https://juejin.im/post/5bb59eb65188255c5121d650 

原创 2 HDFS