歷屆中國大數據技術大會PPT精粹

【CSDN報道】Hadoop起源於2002年的Apache Nutch項目,是Apache Lucene的子項目之一。2004年,Google在OSDI上公開發表了題爲《MapReduce: Simplified Data Processing on Large Clusters》的論文,受到啓發的Doug Cutting等人開始實現MapReduce計算框架並與NDFS(Nutch Distributed File System)結合支持Nutch的主要算法。2006年逐漸成爲一套完整而獨立的軟件,起名爲Hadoop。

2008年初,Hadoop成爲Apache頂級項目。也是在這一年,首屆中國大數據技術大會在北京舉行。過去六年,Hadoop從名不見經傳的菜鳥,一躍成爲大數據領域的黃色大象。

以下爲歷屆中國大數據技術大會PPT精粹第一部分:

MemSQL聯合創始人兼CTO Nikita Shamgunov解析“實時數據分析” PPT下載

Nikita把如今的時代比做是摩爾定律的尾聲,指出如今的計算速度不會再像以前那麼快,然而數據的發展速度卻絲毫沒有停止,同時數據的多樣性也完全爆發。他認爲如今大數據技術最大的難題就是延遲問題,尤其是數據延遲和查詢延遲。在對比了Twitter的Strom和Cloudera的Impala技術之後,他詳細介紹了MemSQL的性能。

阿里巴巴集團數據交換平臺資深專家強琦:大數據探索 PPT下載

強琦稱,阿里巴巴將建立一個數據交換平臺,每個人都可以從這個平臺獲得有價值的數據,但同時需要貢獻自己的數據,這些零散的數據將組成一個藍海,要像銀行一樣玩數據。

Ted Yu:如何在企業中應用HBase PPT下載

Ted擁有14年軟件開發經驗,以及超過兩年的HBase開發經驗,2011年成爲HBase代碼提交者和PMC的成員。 


Hortonworks戴建勇:解讀Apache Pig的性能優化 PPT下載

戴建勇從充分利用Combiner、構建基於規則的優化器、利用Column Pruner以及使用Push up filter等角度,在分區pruning、壓縮中間文件、合併MapReduce作業和控制合併粒度等方面詳細演示瞭如何對Apache Pig的性能進行優化。 

華爲高級技術經理Anoop Sam John:HBase的二級索引 PPT下載

Anoop介紹了華爲在實際工程中對於HBase的優化工作,並分享了華爲基於開源社區建設及長期工程積累的經驗。除此之外,Anoop Sam John還重點介紹了華爲構建的HBase二級索引能力。 

網易資深工程師顧費勇:海量數據搬運工——DataStream PPT下載

顧費勇探討了Datastream產生的原因,結構和特徵,關鍵技術點分享,應用場景和未來展望。大數據最主要的兩個關鍵技術,一個是數據蒐集,一個是數據整合與分析。顧費勇介紹網易在數據蒐集方面做了比較完整的平臺,但沒有跟後端的數據分析組成一個完整的大數據平臺。

威斯康星大學計算機系教授Miron Livny:當Condor遇到Hadoop時的機遇和挑戰 PPT下載

集成了Hadoop的超級計算機集羣Condor形成了非常強大的計算機系統,它的能力達到了可以處理類似於人類基因組合這樣複雜的問題。它用高吞吐量特性代替了傳統的高性能計算,這正好符合了大部分科研對高吞吐量的要求,而不是瞬間的處理速度。

Yahoo!巴塞羅那研究院科學家Flavio Junqueira:Apache BookKeeper——高性能可靠預寫式日誌 PPT下載 

爲了高效的順序寫入,較好的容錯性和可擴展性,設計了BookKeeper。它的結構由他們組成:Bookie(存儲節點),Ledger(日誌文檔),Ensemble(用一組Bookie存儲Ledger)。 

Facebook研發部經理邵錚:Puma與數據高速公路——實時數據流與分析 PPT下載

邵錚介紹了Facebook的分析工具和實時數據的使用案例,以及對於可擴展的數據流如何處理,Puma2和Puma3的結構及不同。


百度基礎架構部高級研發工程師劉景龍:HDFS的透明壓縮存儲和壓縮傳輸 PPT下載

爲節省更多的存儲空間,避免壓縮過程影響計算作業,並且使這一過程對用戶透明,百度在HDFS下使用了透明壓縮存儲和壓縮傳輸的技術。


Facebook公司Jerry Chen/Liyin Tang:在HBase上構建關鍵業務通信系統 PPT下載

Facebook選擇了HBase,因爲它具有高吞吐量,非常良好的隨機讀取性能,很不錯的擴展性,也具有自動備緩功能,很強的兼容性和HDFS的優點。Facebook通常將Small Message,Message metadata和搜索索引存儲在HBase中。

(文/ 包研  審校/仲浩)

歡迎關注 @CSDN雲計算微博,瞭解更多雲信息。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章