ElasticSearch 5.0以後,字符串類型有重大變更,移除了string類型,string字段被拆分成兩種新的數據類型: text和keyword。
text:會分詞,然後進行索引,用於全文搜索。
支持模糊、精確查詢
不支持聚合
keyword:不進行分詞,直接索引,keyword用於關鍵詞搜索
支持模糊、精確查詢
支持聚合
如果不指定類型,ElasticSearch字符串將默認被同時映射成text和keyword類型,會自動創建下面的動態映射(dynamic mappings):
{
"foo": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
}
這就是造成部分字段還會自動生成一個與之對應的“.keyword”字段的原因。
可以手動指定類型:
PUT my_index
{
"mappings": {
"_doc": {
"properties": {
"name": {
"type": "text"
}
}
}
}
}
}
一個字符串字段可以映射爲text字段用於全文本搜索,也可以映射爲keyword字段用於排序或聚合,這時候需要用到fields設置多字段。如果業務關係中,需要該字段支持兩種類型的查詢,可以設置爲如下形式:
PUT my_index
{
"mappings": {
"_doc": {
"properties": {
"name": {
"type": "text",
"fields": {
"raw": {
"type": "keyword"
}
}
}
}
}
}
}
name.raw字段是name字段的keyword版本。
拓展:fields多字段另一個應用場景是,設置不同的字段解析器
PUT my_index
{
"mappings": {
"_doc": {
"properties": {
"name": {
"type": "text",
"fields": {
"english": {
"type": "text",
"analyzer": "english"
}
}
}
}
}
}
}
text類型字段,解析器遇到空格時,會進行分詞,比如“abc, def”會被分成[abc,def],但是“abc,def”不會拆分