一.開發平臺:
•Hadoop是Apache軟件基金會旗下的一個開源分佈式計算平臺
•以分佈式文件系統(Hadoop Distributed File Syste, HDFS)和MapReduce爲核心的Hadoop爲用戶提供了系統底層細節透明分佈式基礎架構
•HDFS的高容錯、高伸縮的優點允許用戶將Hadoop部署在低廉的硬件上
•MapReduce則允許用戶在不瞭解分佈式系統底層細節的情況下開發並行應用程序
二.優勢:
•高可靠性 ---因爲Hadoop假設計算元素和存儲會出現故障,因爲它維護多個工作數據副本,在出現故障時可以對失敗的節點重新分佈處理
•高擴展性 --- 在集羣間分配任務數據,可方便的擴展數以千計的節點
•高效性 ---在MapReduce的思想下,Hadoop是並行工作的,以加快任務處理速度
•高容錯性 --- 自動保存多份副本數據,並且能夠自動將失敗的任務重新分配
三.應用及發展趨勢:
•Yahoo :通過集羣運行Hadoop,以支持廣告系統和Web搜索
•FaceBook: (Hive貢獻者)藉助Hadoop來支持其數據分析和機器學習
•淘寶:國內使用Hadoop最深入的公司,整個淘寶和阿里都是數據驅動的
•華爲:雲計算平臺
•優酷:日誌分析、推薦等
•奇虎360:存儲軟件管家中的軟件,日誌分析和數據挖掘
•百度: 國內使用Hadoop最早的公司,存儲、日誌分析、推薦、機器學習等
hadoop大數據研發平臺
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
javascript 幾種常用繼承方法和信用盤平臺搭建
nianjidale
2019-02-24 12:57:55
企業管理系統一網打盡:力軟C#.NET快速開發平臺,簡單不止一點點
碼農kkk
2019-02-23 13:43:29
《從0到1學習Flink》—— Flink 讀取 Kafka 數據批量寫入到 MySQL
zhisheng
2019-02-24 21:04:11
大數據驅動的運營創新和探索
支付寶技術
2019-02-24 13:49:15
Python——數據類型
陳晨工程師
2019-02-24 13:43:55
撕掉普通程序員的標籤,這纔是真正的大數據工程師!
金羅老師
2019-02-24 13:12:37
深入淺出分佈式文件存儲系統之 Ceph 的實現
qq5c6f4fa42f069
2019-02-24 12:58:23
從無到有構建大型電商微服務億級架構(第一階段)視頻教程
星辰8209
2019-02-24 12:53:42
基於Flink流處理的動態實時億級電商全端用戶畫像系統視頻教程
星辰8209
2019-02-24 12:53:42
從無到有構建大型電商微服務億級架構(第三階段)視頻教程
星辰8209
2019-02-24 12:53:42
大型企業級雲產品-億級數據統計分析系統(涵蓋大數據主流技術)視頻教程
星辰8209
2019-02-24 12:53:42
大數據解碼“老廣”過年的“壕”味
SQ111
2019-02-24 12:50:19
技術創新 | 北農商完善“同城雙中心”災備管理
頡一科技
2019-02-23 13:58:00
頡一軟件查理:數據變現,始於流通
頡一科技
2019-02-23 13:58:00
大數據與教育同頻共振
109573496ld
2019-02-23 13:43:17