Elasticsearch核心技術與實戰學習筆記 39 | 文檔分佈式存儲

原創

2020-06-29 11:04

一序

本文屬於極客時間Elasticsearch核心技術與實戰學習筆記系列。

二文檔儲存在分片上

文檔會存儲在具體的某個主分片和副本分片上：例如文檔 1，會儲存在 P0 R0 分片上
文檔到分片的映射算法

確保文檔能均勻分佈在所用分片上，充分利用硬件資源，避免部分機器空閒，部門機器繁忙
潛在的算法

隨機 / Round Robin. 當查詢文檔 1，分片數很多，需要多次查詢才能查檔文檔 1
維護文檔到分片的映射關係，當文檔數據量大的時候，維護成本高
實時計算，通過文檔 1，自動算出，需要去哪個分片上獲取文檔.

這裏ES採用的就是方案3

2.1 文檔到分片的路由算法

shard = hash(_routing) % number_of_primary_shards

Hash 算法確保文檔均勻分散到分片中
默認的_routing 值是文檔 id
可以自行制定 routing 數值，例如用相同國家的商品，都分配到制定的 shard
設置 Index Setting 後，Primary 數，不能隨意修改的根本原因

2.2 更新文檔

順序： index -> hash -> route -> delete -> index -> success -> response

1, 用戶發出update請求，第一個節點是Coordinating Node，他通過hash計算算出文檔對應分片，路由到這個分片。

更新是執行的兩步，先刪除再創建。成功後返回一個success給Coordinating Node，Coordinating Node再返回response

2.3刪除一個文檔

順序：detele -> hash&route -> delete -> delete replica -> success -> deleted -> response

跟更新類似，多了刪除副本的流程。

補充知識點：

可以設置 Index Settings ，控制數據的分片
Primary Shard 的值不能修改，修改需要重新 Index。
索引寫入數據後，Replica 值可以修改。增加副本，可提高大併發下的讀取性能
通過控制集羣的節點數，設置 Primary Shard 數，實現水平擴展

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Centos7搭建ES服務器步驟以及錯誤解決

簡介 ElasticSearch（簡稱ES） ES即爲了解決原生Lucene使用的不足，優化Lucene的調用方式，並實現了高可用的分佈式集羣的搜索方案，其第一個版本於2010年2月出現在GitHub上並迅速成爲最受歡迎的項目之一。

开开心心写Bug

2020-07-07 11:57:07

ES字段更改遷移老數據

ES版本6.6.2 用kibana說明 1.1-----------------原表 index爲test2，type爲test1 PUT test2

2020-07-06 16:04:17

filebeat、kafka、elk搭建日誌收集系統

本次搭建日誌收集系統是個小demo。用到的工具有鏈接：https://pan.baidu.com/s/1m_If2crjUtMTqRKuKrG9gw 提取碼：n9oi ，工具和代碼工程都在都在這裏。日誌收集的流程如下。這裏只是實現了

2020-07-06 09:13:43

ElasticSearch筆記——ElasticSearch圖形界面插件（二）

下載解壓安裝nodejs shift+右鍵打開當前窗口安裝grant：npm install -g grunt-cli 啓動grunt：先npm install，再grunt server http.cors.en

一笛一剑一玈人

2020-07-06 07:25:08

ES學習------------（1）安裝window版本步驟

最近經常聽別人提起ES，想起我好想除了聽說或ES之外對它簡直是一無所知，所以接下來的幾周我可能都會抽一奈奈時間看看首先就是安裝ES以及可視化文件head或者kibana，我安裝的是window下的head，linux的差不多，學習的話還

快乐的小京巴

2020-07-06 02:35:41

ES學習------------（2）集羣安裝

一、根據上個博客，我們已經安裝好了一個master的主節點，我們只需增加幾個配置就可以了可以連接localhost:9200去看下節點信息，五角星代表的是主節點，而黑色圓圈代表的是從節點二、接下來就可以開始

快乐的小京巴

2020-07-06 02:35:41

ES學習------------（3）集羣索引

集羣索引以及索引數據的增刪改查：注：以下都是通過head進行的操作，會和代碼中有些區別增加索引數據：之前的博客中我們已經創建了索引user，那麼我們直接在這上面去添加數據 {

快乐的小京巴

2020-07-06 02:35:31

ElasticSearch (ES)學習之路（五）ES 複雜搜索（匹配過濾精準排序高亮）

ElasticSearch (ES)學習之路（五）ES 複雜搜索（匹配過濾精準排序高亮）在上文中，我們查詢小紅其kinbana 語法是這樣寫的 GET /lei/one/_search?q=name:小麗

保护我方胖虎

2020-07-06 00:03:14

ES集羣5.3.0升級7.3.0

最近有新項目需要使用中文分詞，然鵝之前安裝的ES5.3.0需要安裝插件，而且老版也沒有自帶安全驗證，考慮之後還是升級吧（一）下載所需要的軟件 wget -b https://download.java.net/java/GA/j

2020-07-05 18:38:28

ElasticSearch 入門教程一（體系結構）

全文檢索的介紹全文檢索的需求介紹首先我們談幾個公司，如雷貫耳的：百度、谷歌、維基百科；這些公司都有一個相似性就是門戶網站，可以提供我們通過關鍵字搜索，然後快速的檢索出我們想要的信息；【網頁百度展示】比如我們檢索關鍵詞，百度

2020-07-05 06:31:39

ElasticSearch 入門教程二（ES集羣搭建與配套軟件安裝）

ES的集羣部署第一步：創建普通用戶（使用root用戶）注意：ES不能使用root用戶來啓動，必須使用普通用戶來安裝啓動。這裏我們創建一個普通用戶以及定義一些常規目錄用於存放我們的數據文件以及安裝包等創建一個es專門的用戶（

2020-07-05 06:31:39

Chrome瀏覽器中安裝使用elasticsearch head 插件

通過chrome安裝插件的方式提供一個可操作es的圖形化界面。在chrome 瀏覽器中，通過“擴展程序” 添加 elasticsearch head 插件的方式，這種方式無須開啓 es的跨域訪問。 1、打開鏈接谷歌瀏覽器訪問

2020-07-03 16:09:57

Elasticsearch部署及使用

hosts解析 vim /etc/hosts 10.0.0.10 es1 10.0.0.11 es2 10.0.0.12 es3 部署jdk mkdir /usr/java tar xf jdk-8u221-linux-x64.

2020-07-03 16:09:57

ES查看segment大小

摘自：http://www.aboutyun.com/thread-17078-1-1.html Segment Memory Segment不是file嗎？segment memory又是什麼？前面提到過，一個segment是一個完

2020-07-03 14:13:56

通過curl更新ES字段的json格式數據

直接上樣例吧： curl -X POST "10.101.36.106:9200/anti_documentcontent_v2_20200630/_update_by_query?pretty" -H 'Content-Type: ap

2020-07-03 07:01:14

24小時熱門文章

最新文章

最新評論文章