大數據面試總結(第一篇)

問題一:TOPk問題
問題二:海量日誌數據,提取出某訪問百度次數最多的那個IP?
問題三:給定a,b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a,b文件共同的url?
問題四:在2.5億個整數中找出不重複的整數?注:內存不足以容納這2.5億個整數?
問題五:騰訊面試題:給40億個不重複的unsigned int的整數,沒排過序,然後再給一個數,如何快速判斷這個數是否在那40億個數當中?
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章