作者:鄭鍇,花名鐵傑,阿里巴巴高級技術專家,Apache Hadoop PMC,Apache Kerby 創立者。深耕分佈式系統開發和開源大數據多年,目前專注於在阿里雲上提供更好用更有彈性的 Hadoop/Spark 大數據平臺。
端午節宅家,Spark + AI Summit 2020 在網上如火如荼。剛看了 Matei 先生的keynote,他對 Spark 10 年做了非常精彩的演講和深情的回顧,不禁很多感想,卻千頭萬緒。我想這次簡單點,不囉嗦,直接挑個重點說吧,看下圖。
這是我在 Youtube 上看的視頻做的一個截圖。這張 slide 無需解讀,我相信大家都能看出以下幾點。
第一. SQL 萬物歸宗,成爲Spark 諸多語言 API 的核心,SparkSQL 和 Spark Core 以後就是一回事。大家可以收收心吧,做