ElasticSearch中字符串類型(Text和keyword)的選擇

ElasticSearch 5.0以後,字符串類型有重大變更,移除了string類型,string字段被拆分成兩種新的數據類型: text和keyword。

text:會分詞,然後進行索引,用於全文搜索。

          支持模糊、精確查詢

          不支持聚合

keyword:不進行分詞,直接索引,keyword用於關鍵詞搜索

                  支持模糊、精確查詢

                  支持聚合

如果不指定類型,ElasticSearch字符串將默認被同時映射成text和keyword類型,會自動創建下面的動態映射(dynamic mappings):

{
    "foo": {
        "type": "text",
        "fields": {
            "keyword": {
                "type": "keyword",
                "ignore_above": 256
            }
        }
    }

}

這就是造成部分字段還會自動生成一個與之對應的“.keyword”字段的原因。

可以手動指定類型:

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "name": {
          "type": "text"
          }
        }
      }
    }
  }
}

一個字符串字段可以映射爲text字段用於全文本搜索,也可以映射爲keyword字段用於排序或聚合,這時候需要用到fields設置多字段。如果業務關係中,需要該字段支持兩種類型的查詢,可以設置爲如下形式:

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "name": {
          "type": "text",
          "fields": {
            "raw": { 
              "type":  "keyword"
            }
          }
        }
      }
    }
  }
}

name.raw字段是name字段的keyword版本。

拓展:fields多字段另一個應用場景是,設置不同的字段解析器

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "name": { 
          "type": "text",
          "fields": {
            "english": { 
              "type":     "text",
              "analyzer": "english"
            }
          }
        }
      }
    }
  }
}

text類型字段,解析器遇到空格時,會進行分詞,比如“abc, def”會被分成[abc,def],但是“abc,def”不會拆分

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章