原创 08-Spark core基礎

文章目錄1.Spark簡介2.Spark內部原理(代碼塊環境爲虛擬機 spark客戶端)2.1RDD2.1.1RDD的創建2.1.2RDD的轉換2.1.2.1Value型2.1.2.2雙Value型交互2.1.2.3Key-Val

原创 03-zookeeper基礎

文章目錄1. zookeeper客戶端命令操作2. zookeeper內部原理2.1 持久化節點和臨時節點2.2 Stat結構體2.3 監聽原理2.4paxos算法2.5選舉機制2.6寫數據流程3.API操作3.1zk客戶端操作3

原创 02-shell基礎

文章目錄1.shell的概述2.第一個shell腳本3.變量3.1普通變量3.2特殊變量4.運算符5.條件判斷6.流程控制6.1if6.2case 語句7.循環7.1for7.2while8.系統函數 1.shell的概述 Li

原创 06-Hbase基礎

文章目錄1.Hbase的架構1.1架構圖1.2Master1.3RegionServer1.4Zookeeper1.5HDFS2.HBase的Shell操作3.HBase的數據模型3.1 rowkey3.2Columns Fami

原创 07-Hive基礎

文章目錄1.Hive簡介1.1Hive的特點1.2HIve的優缺點2.Hive內部原理2.1Hive的架構2.1.1Client(用戶接口)2.1.2Metastore(元數據)2.1.3Driver(驅動器)2.2Hive運行機

原创 flink基礎,刪減版

文章目錄1.flink與spark的對比2.flink內部原理2.1內部組件2.1.1environment2.1.2source2.1.3transform2.1.4sink2.2運行機制2.2.1任務提交模式(yarn)2.3

原创 01-Linux基礎

文章目錄1. linux文本編輯器1.1一般模式(打開文本之後)1.2編輯模式1.3指令模式2.linux常用命令2.1文件目錄類2.2時間操作2.3用戶管理2.5打包操作2.6磁盤分區操作2.7進程操作2.8yum軟件管理3.文

原创 04-hadoop基礎

文章目錄1.大數據概論1.1大數據的概念1.2大數據的業務分析流程1.3大數據的應用場景2.Hadoop2.1Hadoop概述2.1.1Hadoop的優勢2.1.2Hadoop1版本和2版本的區別2.2Hadoop的安裝2.4Ha

原创 05-Flume基礎

文章目錄1.Flume內部原理1.1Flume基礎架構1.2Flume組件1.2.1Agent1.2.2Source1.2.3Sink1.2.4Channel1.2.5 Event1.3Flume事務1.4Flume Agent內