Hadoop

Hadoop:
大數據集羣,只能運行在Linux平臺
RDBMS:表
字段、數據類型、約束
結構化數據
關係數據庫在數據中佔據重要的地位
但不是所有的數據都可以結構化
結構化數據:structured data
非結構化數據:unstructured data
半結構化數據:semi-structured data
通常保存爲xml , json
Google:pagerank 頁面算法
化整爲零,並行處理
將一個大問題切割成多個小問題
OLAP:數據挖掘
機器學習:deep learning
多節點並行處理

Map reduce:
函數式編程API
運行框架

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章