presto使用及介紹

原創

2020-07-04 13:24

什麼是presto

presto是一個開源的分佈式的查詢引擎，基於內存，它本身不接入數據，可以連接多種數據源，例如 Hive ,Mysql,Kafka,MongeDB等，一條Presto查詢可以將多個數據源進行合併查詢。
preto適合OLAP,而非OLTP,所以不要將preto當成數據庫來使用。

presto優勢

低延遲，高併發，純內存計算引擎，查詢效率是hive的數十倍

presto查詢速度規模

數G到數P規模

presto數據模型

分爲Catalog,Schema,Table三層

Catalog: 數據源，例如是Hive，還是Mysql等等
Schema: 庫
Table: 表

presto架構

preso是一個Master-Slave架構，由一個Coordinator節點，一個Disovery Server節點及多個Worker節點組成
Coordinator：負責query解析和分發，work管理，meta管理
Disovery Server: 節點心跳，默認內嵌於Coordinator中，於Coordinator共享一臺機器
Worker:計算節點，收到分發的task任務後，就會去對應的數據源取數

簡單流程

Worker節點啓動後向Discovery Server服務註冊，Coordinator從Disovery Server獲得正常工作的Worker節點，

presto 接入方式

使用Prosot的方式有多種: presto-cli,jdbc,http等等

以presto-cli爲例接入hive數據源：

./presto-cli.jar --server presto.xxx.com:9200 --catalog hive --schema xxx 就可以進入presto終端界面

preto缺點

容錯能力差：當一個worker節點掛掉或者其他原因導致該worker節點上的查詢失敗的時候，整個query也會失敗
內存限制：目前版本presto基於純內存計算，內存不夠也會失敗，不會dump到磁盤上
並行查詢：因所有的task都是並行計算，一個很慢會導致整個都很慢
併發限制: 因全內存操作，會導致同時處理的任務有限

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「Java開發指南」如何用MyEclipse搭建GWT 2.1和Spring？（二）

本教程將指導您如何生成一個可運行的Google Web Toolkit (GWT) 2.1和Spring應用程序，該應用程序爲域模型實現了CRUD應用程序模式。在本教程中，您將學習如何：安裝Google Eclipse插件爲GWT配置

2024-05-17 12:21:26

Java ThreadPoolShutdown

CountDownLatch 是 Java 中的一個同步工具類，它允許一個或多個線程等待一系列指定操作執行完成。CountDownLatch 的主要方法有兩個：await() 方法等待 countDown 方法被調用指定的次數後繼續執行，c

2024-05-17 02:06:32

通過MVEL表達式和Apache Chain職責鏈模式解耦MQ消息處理節點的實踐應用

導讀本文主要講解了MVEL表達式和責任鏈設計模式相結合一起的消息處理解決方案設計、解耦消息處理節點以及方便代碼維護擴展。通過“訂單拆單消息”的接入作爲具體實踐案例，簡要闡述了MVEL表達式和Apache Chain職責鏈設計模式應用場景。

2024-05-16 23:56:24

Spring @EnableXxx註解的使用理解

@EnableXxx註解 Spring有很多@EnableXxx這種形式的註解，類似於可以一鍵打開某項功能，相當於暴露給用戶的一種便捷的配置API，例如 @EnableAsync 激活異步執行能力，@EnableTransactionMan

2024-05-16 23:48:06

java將list結果分成3份執行原創

Java將List結果分成3份執行在Java編程中，有時候我們需要將一個List集合中的元素分成幾部分進行處理。這種情況下，我們可以使用Java的相關類庫和API來實現這一需求。在本文中，我們將介紹如何使用Java將List結果分成3份執

2024-05-16 02:09:55

OSS_PIPE：Rust編寫的大規模文件遷移工具

‍ 隨着業務的發展，文件數量和文件大小會急劇增加，文件遷移的數量和難度不斷攀升。oss_pipe 是rust編寫的文件遷移工具，旨在支撐大規模的文件遷移場景。編寫 oss_pipe 的初衷 •同類產品面臨的問題 •rust 語

京東雲開發者

2024-05-15 23:59:27

高效調度新篇章：詳解DolphinScheduler 3.2.0生產級集羣搭建

轉載自tuoluzhe8521 導讀：通過簡化複雜的任務依賴關係， DolphinScheduler爲數據工程師提供了強大的工作流程管理和調度能力。在3.2.0版本中，DolphinScheduler帶來了一系列新功能和改進，使其在生產環

2024-05-15 21:22:54

Spring cloud gateway入門

微服務Gateway 微服務網關部署在前端Nginx網關和後端微服務之間，Nginx一般充當流量網關，而微服務網關屬於一種業務型網關，微服務網關層爲後端的微服務羣組提供統一的接入地址，其核心功能是統一做服務路由，在路由基礎上還可以實現一

2024-05-15 11:50:15

JDBC連接openGauss6.0和PostgreSQL16.2性能對比

本文分享自華爲雲社區《JDBC連接openGauss6.0和PostgreSQL16.2性能對比》，作者： Gauss松鼠會小助手。 PostgreSQL vs openGauss 01 前置準備安裝JDK：詳細安裝步驟請問度娘，輸

2024-05-14 11:00:08

爲什麼阿里不建議用excutors創建線程池

1 前言：大家都知道，阿里規範中有一條是不允許用excutors去創建線程池，而是採用ThreadPoolExecutor的原生方式去創建。很早就聽過所過這種說法，但是一直都沒去搞清楚是爲什麼，今天就查閱資料去了解了這

2024-05-14 02:07:06

Java遊戲服務器3

1)編碼消息長度(short int-->2個字節) + 消息編號(short int--》2個字節) + 消息體 2)Protobuf協議文檔 (1)syntax="proto3"; (2)命名格式

2024-05-14 02:04:28

Android內存管理機制官方詳解文檔

很早之前寫過一篇《Android內存管理機制詳解》點擊量已7萬+，現把Google官方文檔整理輸出一下，供各位參考。一、內存管理概覽 Android 運行時 (ART) 和 Dalvik 虛擬機使用分頁和內存映射來管理內存。這意味着應用

2024-05-14 00:37:42

OSS_PIPE：Rust編寫的大規模文件遷移工具| 京東雲技術團隊

文盤rust 好久沒有更新了。這段時間筆者用rust寫了個小東西，跟各位分享一下背景隨着業務的發展，文件數量和文件大小會急劇增加，文件遷移的數量和難度不斷攀升。oss_pipe 是rust編寫的文件遷移工具，旨在支撐大規模的文件遷移場

2024-05-13 23:59:27

面試官：說說你對序列化的理解

本文主要內容背景在Java語言中，程序運行的時候，會產生很多對象，而對象信息也只是在程序運行的時候纔在內存中保持其狀態，一旦程序停止，內存釋放，對象也就不存在了。怎麼能讓對象永久的保存下來呢？--------對象序列化。何

2024-05-13 22:58:28

JAVA基礎之常用類（一）String

綱要 String StringBuffer 基礎類型對應的8個包裝類日期相關類數字相關類 Random Enum 1. 理解String類的存儲原理 String類是不可變類，也就是說String對象聲明後，將不可修改。 S

2024-05-13 22:07:29

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章