Hadoop概述

Hadoop的歷史:

1.Apache Lucene

》全球第一個開源的全文檢索引擎工具包

》完整的查詢引擎和索引引擎

》部分文本分析引擎

》開發人員可在此基礎建立起完整的全文檢索引擎

2.Nutch

》開源的的基於Lucene的網頁搜索引擎

》加入網頁抓取、解析等功能

》類似於Google等商業搜索引擎

Google的兩篇重要論文:

》Google File System

》MapReduce架構:Simplified Data Processing on Large Clusters

 Hadoop官網:http://hadoop.apache.org
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章