spark 教程

這一兩年Spark技術很火,自己也湊熱鬧,反覆的試驗、研究,有痛苦萬分也有欣喜若狂,抽空把這些整理成文章共享給大家。這個系列基本上圍繞了Spark生態圈進行介紹,從Spark的簡介、編譯、部署,再到編程模型、運行架構,最後介紹其組件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章內容的整理一般是先介紹原理,隨後是實戰例子,由於面向的是入門讀者,在實戰中多截圖,還請諒解。爲了大家實驗方便,在這裏把實驗相關的測試數據和安裝包放在百度盤提供下載 地址爲http://pan.baidu.com/s/1o7HpDEy 密碼:9xjt

本系列博客在博客園和CSDN首發,地址爲:

博客園 http://www.cnblogs.com/shishanyuan

CSDN http://blog.csdn.net/yirenboy

以下爲該系列文章列表:

1.Spark及其生態圈簡介  下載

2.Spark編譯與部署(上)--基礎環境搭建  下載

2.Spark編譯與部署(中)--Hadoop編譯安裝  下載

2.Spark編譯與部署(下)--Spark編譯安裝  下載

3.Spark編程模型(上)--編程模型及SparkShell實戰  下載

3.Spark編程模型(下)--IDEA搭建及實戰  下載

4.Spark運行架構  下載

5.Hive(上)--Hive介紹及部署  下載

5.Hive(下)--Hive實戰  下載

6.SparkSQL(上)--SparkSQL簡介  下載

6.SparkSQL(中)--深入瞭解運行計劃及調優  下載

6.SparkSQL(下)--Spark實戰應用  下載

7.Spark Streaming(上)--實時流計算Spark Streaming原理介紹  下載

7.Spark Streaming(下)--實時流計算Spark Streaming實戰  下載 

8.Spark MLlib(上)--機器學習及SparkMLlib簡介  下載 

8.Spark MLlib(下)--機器學習庫SparkMLlib實戰  下載

9.Spark圖計算GraphX  下載

10.分佈式內存文件系統Tachyon介紹及安裝部署  下載

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章