Elasticsearch--概述

Elasticsearch概述

Elasticsearch(ES)是一個基於Lucene構建的開源、分佈式、RESTful接口全文搜索引擎。Elasticsearch還是一個分佈式文檔數據庫,其中每個字段均是被索引的數據且可被搜索,它能夠擴展至數以百計的服務器存儲以及處理PB級的數據。它可以在很短時間內存儲、搜索和分析大量的數據。它通常作爲具有複雜搜索場景情況下的核心發動機。

Elasticsearch優點

  • 橫向可擴展性: 只需要增加一臺服務器,做一點配置,啓動一下Elasticsearch進程就可以併入集羣。
  • 分片機制提供更好的分佈性: 同一個索引分成多個分片(sharding),這點類似於HDFS的塊機制;分而治之的方式可提升處理效率。
  • 高可用: 提供複製(replica)機制,一個分片可以設置多個複製,使得某臺服務器在宕機的情況下,集羣仍舊可以照常運行,並會把服務器宕機丟失的數據信息複製恢復到其他可用節點上。
  • 使用簡單: 只需要一條命令就可以下載文件,然後很快就能搭建一個站內搜索引擎。

全文搜索

全文搜索是指計算機搜索程序通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置,當哦那個胡查詢時,搜索程序就根據事先建立的索引進行查找,並將查找的結果反饋給用戶。這個過程類似於通過字典中的搜索子表查字的過程。Lucene是目前全球使用最廣的全文搜索引擎開源庫。

Lucene介紹

Lucene是Apache軟件基金會中一個開放源代碼的全文搜索引擎工具包,是一個全文搜索引擎的架構,提供了完整的查詢引擎,部分文本分析引擎。Lucene的目的是爲軟件開發人員提供一個簡單易用5的工具包,以方便在目標系統中實現全文檢索的功能,或者是以此爲基礎建立起完整的全文搜索引擎。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章