海量大數據處理

https://blog.csdn.net/v_july_v/article/details/7382693

  1. 分而治之/hash映射 + hash統計 + 堆/快速/歸併排序;(分內存對象、分表、分文件存儲)
  2. 雙層桶劃分 
  3. Bloom filter/Bitmap;查存在、查重對比.....
  4. Trie樹/數據庫/倒排索引;
  5. 外排序 歸併結果;
  6. 分佈式處理之Hadoop/Mapreduce。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章