Hadoop的歷史:
1.Apache Lucene
》全球第一個開源的全文檢索引擎工具包
》完整的查詢引擎和索引引擎
》部分文本分析引擎
》開發人員可在此基礎建立起完整的全文檢索引擎
2.Nutch
》開源的的基於Lucene的網頁搜索引擎
》加入網頁抓取、解析等功能
》類似於Google等商業搜索引擎
Google的兩篇重要論文:
》Google File System
》MapReduce架構:Simplified Data Processing on Large Clusters
Hadoop官網:http://hadoop.apache.org
Hadoop概述
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
MapReduce學習之好友推薦
may-bee
2018-08-27 19:24:41
Flume+Kafka+SparkStreaming整合
wangweislk
2018-08-27 19:21:52
Mahout中關於MultiLayer Perceptron模塊的源碼解析
HaleGe
2018-08-27 19:08:52
解決Hadoop運行jar包時MapReduce任務啓動前OutOfMemoryError:Java heap space問題
HaleGe
2018-08-27 19:06:30
Note for Hadoop
Adminse
2018-08-27 18:06:57
hadoop集羣搭建步驟整理及事項
T_ESC
2018-08-27 18:04:59
Hadoop相關Linux命令整理
T_ESC
2018-08-27 18:04:59
hadoop 裏執行 MapReduce 任務的幾種常見方式
乐路
2018-08-27 17:59:49
Hadoop本地庫與系統版本不一致引起的錯誤解決方法
乐路
2018-08-27 17:59:46
Hadoop 2.0集羣配置詳細教程
乐路
2018-08-27 17:59:46
Kylin 安裝以及spark cube 的創建
筱Mary
2018-08-27 17:03:04
HDFS Balancer(翻譯)
周小虎_
2018-08-27 16:47:41
NameNode HA(翻譯)
周小虎_
2018-08-27 16:47:40
Hadoop-2.5.0手動編譯
周小虎_
2018-08-27 16:47:40