淺談Flink

原創

2020-04-21 18:13

淺談Flink
Apache Flink 是一個面向數據流處理和批量數據處理的分佈式的開源計算框架，能夠支持流處理和批處理兩種應用類型。有着低延遲、Exactly-once 保證，而批處理需要支持高吞吐、高效處理的特點。
Flink 完全支持流處理，也就是說作爲流處理看待時，輸入數據流是無界的；批處理被作爲一種特殊的流處理，只是它的輸入數據流被定義爲有界的。這與 Spark streaming 不同，Spark streaming 是將流處理視爲無限個有界的批處理（microbatch）。
Flink 特點
有狀態計算的 Exactly-once 語義。狀態是指 flink 能夠維護數據在時序上的聚類和聚合，同時它的 checkpoint 機制可以方便快速的做出失敗重試；
支持帶有事件時間（event time）語義的流處理和窗口處理。事件時間的語義使流計算的結果更加精確，尤其在事件到達無序或者延遲的情況下；
支持高度靈活的窗口（window）操作。支持基於 time、count、session，以及 data-driven 的窗口操作，能很好的對現實環境中的創建的數據進行建模；
輕量的容錯處理（fault tolerance）。它使得系統既能保持高的吞吐率又能保證 exactly-once 的一致性。通過輕量的 state snapshots 實現；
支持高吞吐、低延遲、高性能的流處理；
支持 savepoints 機制（一般手動觸發），可以將應用的運行狀態保存下來；在升級應用或者處理歷史數據上，能夠做到無狀態丟失和最小停機時間；
支持大規模的集羣模式，支持 yarn、Mesos。可運行在成千上萬的節點上；
支持具有 Backpressure 功能的持續流模型；
Flink 在 JVM 內部實現了自己的內存管理，包括完善的內存架構和 OOM error prevention；
支持迭代計算；
支持程序自動優化：避免特定情況下 Shuffle、排序等昂貴操作，中間結果進行緩存。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

風控指南：國內車險欺詐呈現四大趨勢

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

白鯨開源CEO郭煒在2024 DataOps發展大會上獲聘專家

2024年5月15日，白鯨開源CEO郭煒在2024 DataOps發展大會上被正式聘任爲DataOps專家，並獲得了榮譽證書。本次大會由中國通信標準化協會主辦，中關村科學城管委會提供支持，大數據技術標準推進委員會（CCSATC601）承辦，

2024-05-16 11:28:50

構建無服務器數倉（三）EMR Serverless 操作要點、優化以及開放集成測試

引言在數據驅動的世界中，企業正在尋求可靠且高性能的解決方案來管理其不斷增長的數據需求。本系列博客從一個重視數據安全和合規性的 B2C 金融科技客戶的角度來討論雲上雲下混合部署的情況下如何利用亞馬遜雲科技雲原生服務、開源社區產品以及第三方工

2024-05-23 21:22:10

圖表控件LightningChart JS v5.2正式發佈 - 全新的開發體驗

LightningChart JS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空

2024-05-23 12:20:12

安全分析：國內一些常見的汽車保險欺詐案件

2024年3月，北京警方打掉一個故意製造事故實施騙保的專業保險詐騙犯罪團伙。此案中，某保險公司在職員工與離職員工、定點汽修廠內外勾連，通過虛構、故意製造車輛事故或對事故擴損等手段騙取理賠款。不久前，遼寧警方也破獲一起自導自演僞造車禍騙保的案

2024-05-22 00:17:52

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

5月21日，文心中國行將走進上海，在張江科學會堂舉行。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，主要圍繞大模型技術如何賦能產業級應用創新展開探討，還有百度風投從投資視角帶來的觀點，讓參會者全方位瞭解

2024-05-17 00:28:21

2024數據標註公司20強排行榜（附榜單）

近日，德本諮詢發佈“2024數據標註公司排行”。數據標註行業作爲人工智能領域的重要組成部分，其需求正在不斷增長。近年來，數據標註行業發展迅速，規模實現了顯著增長。以2023年爲例，該行業的規模已經達到了60.8億元，同比增長了約19.69

2024-05-16 02:09:44

好勁！Zabbix Meetup廣州站精彩回顧

Zabbix Meetup 廣州站精彩回顧 4月27日，Zabbix城市行再次來到廣州，於未來社區成功舉辦。天氣不佳但熱情依舊，這場盛會集合了講師們的經驗心得、案例分享，5

2024-05-24 22:34:06

飛天發佈時刻｜阿里雲可觀測全速演進

在數字化轉型的浪潮中，雲計算的深化應用不斷推動着技術邊界的擴展，而可觀測性作爲確保系統穩定運行與高效迭代的關鍵支撐，正逐漸成爲現代雲原生架構不可或缺的一部分。5 月 22 日 10:00，阿里雲飛天發佈時刻，阿里雲應用實時監控服務 ARMS

2024-05-24 21:13:46

分佈式任務調度內的 MySQL 分頁查詢優化

作者：vivo 互聯網數據庫團隊- Qiu Xinbo 本文主要通過圖示介紹了用主鍵進行分片查詢的過程，介紹了主鍵分頁查詢存在SQL性能問題，如何去創建高效的索引去優化主鍵分頁查詢的SQL性能問題對於數據分佈不均

2024-05-24 12:09:18

KubeEdge v1.17.0發佈！數據處理能力與易用性全面提升

本文分享自華爲雲社區《KubeEdge v1.17.0發佈！數據處理能力與易用性全面提升》，作者：雲容器大未來。 KubeEdge社區v1.17.0 版本正式發佈。新版本爲邊緣節點和設備帶來了更多的新能力，同時持續在易用性上

2024-05-23 10:58:31

Gen AI 連接非結構化數據，Unstructured Data Meetup 第二場官宣杭州！

定了！6 月 15 日，備受硅谷開發者喜愛的 Unstructured Data Meetup 第二場將在杭州舉辦！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 202

2024-05-20 21:25:07

網絡爬蟲安全：90後小夥，用軟件非法搬運他人原創視頻被判刑

央視《今日說法》欄目近日報道了一名程序員開發非法視頻搬運軟件獲利超700多萬，最終獲刑的案例。國內某知名短視頻平臺報警稱，有人在網絡上售賣一款視頻搬運軟件，使用軟件的人可以繞過平臺的審覈機制，一鍵“搬運”竊取他人作品非法轉載投稿。警方調查

2024-05-16 00:19:26

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過

2024-05-15 21:26:01

五款擴展組件齊發 —— Volcano、Keda、Crane-scheduler 等，邀你體驗

今年 3 月，KubeSphere 啓動了首屆擴展組件開發者訓練營，吸引了 60 名開發者報名。經過一個半月的密集培訓和實戰演練，這些開發者成功打造了五款創新的擴展組件，現已全部上架至 KubeSphere Marketplace，歡迎大家

2024-05-23 11:17:40

24小時熱門文章

最新文章

淺談Flink

最新評論文章