elasticsearch 查詢優化

原創

哈哈和呵呵

2020-06-24 09:11

首先對不必要的字段不做分詞也就是不做索引，禁止內存交換

1.shard

一個Shard就是一個Lucene實例，是一個完整的搜索引擎。
分片數過多會導致檢索時打開比較多的文件，多臺服務器之間通訊成本加大。
而分片數過少會導至單個分片索引過大，所以檢索速度也會慢。
建議單個分片最多存儲10G-20G左右的索引數據，並且儘量集羣的所有節點都分片數一致，不要出現分片數不一樣導致的一個實例負載過大，等待合併的時間變長；

2.shard副本

使用副本的優點：數據備份，提高對大索引的查詢效率，建議副本在1-2個左右，過多的副本會延遲合併時間以及磁盤使用率提高，性價比不高
當要導入大量數據時，設置副本爲0，之後動態添加副本 //（效率較大）當導入大量索引時，設置了副本數，es會同時打開副本同步，消耗系統資源，同時需要額外提供主副之間的通信
設置副本數curl -XPOST 'http://localhost:9200/{_index}/_settings' -d '{"index":{"number_of_replicas":1}}'

3.segment

每個分片包含多個segment，每一個segment都是一個倒排索引；在查詢的時，會把所有的segment查詢結果彙總歸併後最爲最終的分片查詢結果返回； segment越多,加載到內存中的segment越多，佔用segment memory越多，查詢性能可能就會下降，因此應該合併小的segment，減小segment數，提高檢索的segment數來提高查詢效率；創建索引的時候，elasticsearch會把文檔信息寫到內存buffer中，elasticsearch定期會執行flush操作，把segment持久化到磁盤上，索引越大，segment越多，查詢效率就會下降

---- 合併索引段落語句

curl -XPOST 'http://localhost:9200/{_index}/_forcemerge?max_num_segments=1'

4：路由優化

ES中所謂的路由和IP網絡不同，是一個類似於Tag的東西。在創建文檔的時候，可以通過字段爲文檔增加一個路由屬性的Tag。ES內在機制決定了擁有相同路由屬性的文檔，一定會被分配到同一個分片上，無論是主分片還是副本。那麼，在查詢的過程中，一旦指定了感興趣的路由屬性，ES就可以直接到相應的分片所在的機器上進行搜索，而避免了複雜的分佈式協同的一些工作，從而提升了ES的性能。於此同時，假設機器1上存有路由屬性A的文檔，機器2上存有路由屬性爲B的文檔，那麼我在查詢的時候一旦指定目標路由屬性爲A，即使機器2故障癱瘓，對機器1構不成很大影響，所以這麼做對災況下的查詢也提出瞭解決方案。所謂的路由，本質上是一個分桶（Bucketing）操作。當然，查詢中也可以指定多個路由屬性，機制大同小異
轉Elasticsearch模塊功能之-路由（routing）https://blog.csdn.net/changong28/article/details/38427311

5:GC調優

　　elasticSearch本質上是個Java程序，所以配置JVM垃圾回收器本身也是一個很有意義的工作。我們使用JVM的Xms和Xmx參數來提供指定內存大小，本質上提供的是JVM的堆空間大小，當JVM的堆空間不足的時候就會觸發致命的OutOfMemoryException。這意味着要麼內存不足，要麼出現了內存泄露。處理GC問題，首先要確定問題的源頭，一般有兩種方案
開啓ElasticSearch上的GC日誌：在ES的配置文件elasticsearch.yml中有相關的屬性可以配置
使用jstat命令：jstat命令可以幫助我們查看JVM堆中各個區的使用情況和GC的耗時情況。
生成內存Dump：最後的辦法就是將JVM的堆空間轉儲到文件中去，實質上是對JVM堆空間的一個快照

　　想了解更多關於JVM本身GC調優方法請參考：http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html

採用G1垃圾回收機制代替默認CMS(得觀察是否真的有必要)
JAVA_OPTS="$JAVA_OPTS -XX:+UseG1GC"
JAVA_OPTS="$JAVA_OPTS -XX:MaxGCPauseMillis=200"

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

解決 es 父子文檔存儲錯誤 current_type [join], merged_type [ObjectMapper]

之前存儲父子文檔一直可以的，後來在另一處用同樣的代碼，怎麼都存儲失敗，總是報 Elasticsearch exception [type=illegal_argument_exception, reason=mapper [xxx]

2020-07-08 01:05:31

Elasticsearch (ES) 學習之路（三） IK 分詞器安裝與使用自定義詞典

Elasticsearch (ES) 學習之路三 IK 分詞器安裝與使用 IK分詞器在是一款基於詞典和規則的中文分詞器,如果項目所做業務爲國內業務那麼使用IK分詞器即可滿足大部分分詞場景 IK 分詞安裝（Win）解壓上

保护我方胖虎

2020-07-06 00:41:23

java連接es9300端口None of the configured nodes are available

使用的es版本：6.5.3 使用的java框架:springboot-data-elasticsearch 2.X版本在使用java程序連接es的時候，報錯： None of the configured nodes are

weixin_42982636

2020-07-08 11:21:30

記一次配置es索引時遇到的坑，映射字段類型變成Fields。keyword變成text

es版本：6.5.4 如題，最近做項目時遇到這樣一個問題。本來配置的索引應該是: 通過esTemplate創建index和type之後，變成了這樣：本應該是type:keyword的字段變成了fields:{}… 導致：搜

weixin_42982636

2020-07-08 11:21:30

dataocean平臺用繼承spark的python腳本來實現抓取es數據到hive

在大數據生態裏，ES作爲一個極致搜索平臺，可依據json格式快速在線查詢過濾以及修改數據，由於json數據是半結構化數據，所以從hive數倉數據交換到es很簡單，但是從es交換到hive就需要對應字段切分，現在基本上使用的都是scala，

江楼月美人

2020-07-08 00:54:49

es-head chrome插件請求報錯 Content-Type header [application/x-www-form-urlencoded] is not supported

es-head chrome插件請求報錯： Content-Type header [application/x-www-form-urlencoded] is not supported 如圖：對應方法：修改目錄（elastics

2020-07-07 21:38:56

ES-javaAPI

1. javaAPI操作 1.1 elasticsearch-rest-client (1) maven依賴 <dependency> <groupId>org.elasticsearch.client</gro

2020-07-07 17:39:20

ES-endpoint

1 常用endpoint 方式 endpoint 描述 PUT [index] 新建索引請求體可參考:2.1 新建索引請求體樣式 _template/[template] 添加模板請求體可參考:2.2 新建模板請求體樣式

2020-07-07 17:39:20

基於docker的elasticsearch 7.5.1 搭建

Es數據庫（單節點） 1.1.1拉取ES docker 鏡像 docker pull elasticsearch:7.5.1 1.1.2創建ES綁定數據卷 mkdir /root/ES/config/ mkdir /root/

2020-07-07 09:32:48

ES複雜類型數據同步到HIVE數倉

數倉中重要的一個數據同步環節是將ES的數據同步到hive數倉中進行分析，對於普通的平級沒有嵌套的數據來說很容易同步，但是對於嵌套類型需要考慮的點就多了，以下是一些乾貨，在此記錄一下。 1、環境說明 ES Version: 7.2

2020-07-07 02:03:44

解決Elasticsearch啓動後，可以進行外網訪問

今天遇到一個問題就是在win10環境下，啓動Elasticsearch，但是隻能用127.0.0.1:9200或者localhost:9200進行訪問，輸入本機ip+端口就訪問不了，後來從網上找資料，發現需要修改配置文件，於是修改配置文件

2020-07-07 01:37:09

Es爲Hbase創建二級索引思路

一、說明 1、由於數據量巨大的時候，單純的Hbase查詢就會變得比較慢。如果讓Hbase查詢再快一些，就要爲其創建二級索引。爲Hbase創建二級索引一般有兩種思路，一個思路是使用phoenix爲Hbase創建二級索引，另一個思路是使用es

时不我待，一日千里

2020-07-06 03:53:24

ElasticSearch (ES)學習之路（一）ES 概念

ElasticSearch (ES)學習之路（一）最近在自主學習全文檢索技術中… 爲什麼咱們的數據庫有了查詢查詢功能還要額外使用其餘的搜索技術？爲什麼要用搜索引擎？我們的所有數據在數據庫裏面都有，而且 Oracle、Mysql

保护我方胖虎

2020-07-06 00:03:26

ElasticSearch (ES)學習之路（二）Win10安裝ES，可視化界面，Kibanna

ElasticSearch (ES)學習之路（二）Win10安裝ES，可視化界面，Kibanna 我前一段時間學習的時候ES 還是7.6.x 現在看ES 官網已經到了7.8.X了,迭代維護的速度還是挺快的。個人安裝軟件ES Ki

保护我方胖虎

2020-07-06 00:03:15

ElasticSearch (ES)學習之路（四）ES 中個別專有名詞解釋，以及在Kibanna中使用Resful風格操作ES

ElasticSearch (ES)學習之路（四）ES 中個別專有名詞解釋，以及在Kibanna中使用Resful風格操作ES （一）個別名詞解釋： Cluster （集羣）一個集羣包含一個或多個分配了相同的集羣名稱的節點。每個

保护我方胖虎

2020-07-06 00:03:15

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章