分佈式大數據SQL查詢引擎--Presto

參考文章: presto簡介

PRESTO是什麼?

Presto是一個開源的分佈式SQL查詢引擎,適用於交互式分析查詢,數據量支持GB到PB字節。

Presto的設計和編寫完全是爲了解決像Facebook這樣規模的商業數據倉庫的交互式分析和處理速度的問題。

它可以做什麼?

Presto支持在線數據查詢,包括Hive, Cassandra, 關係數據庫以及專有數據存儲。 一條Presto查詢可以將多個數據源的數據進行合併,可以跨越整個組織進行分析。

Presto以分析師的需求作爲目標,他們期望響應時間小於1秒到幾分鐘。 Presto終結了數據分析的兩難選擇,要麼使用速度快的昂貴的商業方案,要麼使用消耗大量硬件的慢速的“免費”方案。

誰在使用它?

Facebook使用Presto進行交互式查詢,用於多個內部數據存儲,包括300PB的數據倉庫。 每天有1000多名Facebook員工使用Presto,執行查詢次數超過30000次,掃描數據總量超過1PB。

領先的互聯網公司包括Airbnb和Dropbox都在使用Presto。

Presto令人吃驚。 首席工程師Andy Kramolisch剛在生產環境使用了幾天。 在大多數情況下它比Hive快幾個數量級。 與Redshift不同,它直接從HDFS讀取數據,在使用前不需要大量的ETL操作,就可以工作。

Christopher Gutierrez, 在線分析經理, Airbnb

我們對Presto感到非常興奮。 我們打算用它快速獲取用戶使用Dropbox的不同方式,以及診斷他們遇到的問題。 在我們目前的測試中,它應用於某些最重要的特別用例,它表現穩定並且非常快。

Fred Wulff, 軟件工程師, Dropbox
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章