Hadoop:
大數據集羣,只能運行在Linux平臺
RDBMS:表
字段、數據類型、約束
結構化數據
關係數據庫在數據中佔據重要的地位
但不是所有的數據都可以結構化
結構化數據:structured data
非結構化數據:unstructured data
半結構化數據:semi-structured data
通常保存爲xml , json
Google:pagerank 頁面算法
化整爲零,並行處理
將一個大問題切割成多個小問題
OLAP:數據挖掘
機器學習:deep learning
多節點並行處理
Map reduce:
函數式編程API
運行框架