Mapreduce的combiner

原創

2018-09-14 02:01

每一個map都可能會產生大量的本地輸出，Combiner的作用就是對map端的輸出先做一次合併，以減少在map和reduce節點之間的數據傳輸量，以提高網絡IO性能，是MapReduce的一種優化手段之一。
l combiner是MR程序中Mapper和Reducer之外的一種組件
l combiner組件的父類就是Reducer
l combiner和reducer的區別在於運行的位置：
Combiner是在每一個maptask所在的節點運行
Reducer是接收全局所有Mapper的輸出結果；
l combiner的意義就是對每一個maptask的輸出進行局部彙總，以減小網絡傳輸量
l 具體實現步驟：
1、自定義一個combiner繼承Reducer，重寫reduce方法
2、在job中設置： job.setCombinerClass(CustomCombiner.class)
l combiner能夠應用的前提是不能影響最終的業務邏輯，而且，combiner的輸出kv應該跟reducer的輸入kv類型要對應起來

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Mapreduce的combiner

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

編寫服務器代碼，實現收派標準分頁查詢

datagrid 數據表格分頁原理

Spring Data 常用 API之原理分析和基本 API

Spring data Query 使用實現條件查詢

jQuery Easyui datagrid 數據表格的使用

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結