ElastchSearch 基本使用姿势

ElastchSearch 基本使用姿势，如常见的

添加文档
常见的查询姿势
修改/删除文档

ElastchSearch 基本使用姿势

1. 添加文档

首次添加文档时，若索引不存在会自动创建；借助 kibana 的dev-tools来实现 es 的交互

POST first-index/_doc
{
  "@timestamp": "2021-03-31T01:12:00",
  "message": "GET /search HTTP/1.1 200 1070000",
  "user": {
    "id": "YiHui",
    "name": "一灰灰Blog"
  },
  "addr": {
    "country": "cn",
    "province": "hubei",
    "city": "wuhan"
  },
  "age": 18
}

## 添加两个数据进行测试
POST first-index/_doc
{
  "@timestamp": "2021-03-31T02:12:00",
  "message": "GET /search HTTP/1.1 200 1070000",
  "user": {
    "id": "ErHui",
    "name": "二灰灰Blog"
  },
  "addr": {
    "country": "cn",
    "province": "hubei",
    "city": "wuhan"
  },
  "age": 19
}

当然也可以直接使用 http 进行交互，下面的方式和上面等价（后面都使用 kibanan 进行交互，更直观一点）

curl  -X POST 'http://localhost:9200/first-index/_doc?pretty' -H 'Content-Type: application/json' -d '
{
  "@timestamp": "2021-03-31T01:12:00",
  "message": "GET /search HTTP/1.1 200 1070000",
  "user": {
    "id": "YiHui",
    "name": "一灰灰Blog"
  },
  "addr": {
    "country": "cn",
    "province": "hubei",
    "city": "wuhan"
  },
  "age": 18
}'

2. 查询文档

2.0 kibana 配置并查询

除了基础的查询语法之外，直接使用 kibana 进行查询，对于使用方而言，门槛最低；首先配置上面的 es 索引

Management -> Stack Management -> Kiabana Index Patterns
index pattern name
时间字段，选择 @timestamp 这个与实际的文档中的 field 有关

接下来进入Discover 进行查询

比如字段查询

2.1 查询所有

不加任何匹配，捞出文档(当数据量很多时，当然也不会真的全部返回，也是会做分页的)

GET my-index/_search
{
  "query": {
    "match_all": {
    }
  }
}

2.2 term 精确匹配

根据 field 进行 value 匹配，忽略大小写;

查询语法，形如: `{"query": {"term": {"成员名": {"value": "查询值"}}}}

query, term, value 三个 key 为固定值
成员名: 为待查询的成员
查询值: 需要匹配的值

(说明：后面语法中，中文的都是需要替换的，英文的为固定值)

GET first-index/_search
{
  "query": {
    "term": {
      "user.id": {
        "value": "yihui"
      }
    }
  }
}

当 value 不匹配，或者查询的 field 不存在，则查不到的对应的信息，如

2.3 terms 多值匹配

term 表示 value 的精确匹配，如果我希望类似value in (xxx)的查询，则可以使用 terms

语法:

{
	"query": {
		"terms": {
			"成员名": [成员值, 成员值]
		}
	}
}

实例如

GET first-index/_search
{
  "query": {
    "terms": {
      "user.id": ["yihui", "erhui"]
    }
  }
}

2.4 range 范围匹配

适用于数值、日期的比较查询，如常见的 >, >=, <, <=

查询语法

{
	"query": {
        "range": {
            "成员名": {
                "gte": "查询下界" ,
                "lte": "查询下界"
            }
        }
	}
}

范围操作符	说明
`gt`	大于 >
`gte`	大于等于 >=
`lt`	小于 <
`lte`	小于等于 <=

实例如下

GET first-index/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 10,
        "lte": 18
      }
    }
  }
}

2.5 字段过滤

根据是否包含某个字段来查询，主要有两个 exists 表示要求存在， missing表示要求不存在

查询语法

{
    "query": {
        "exists/missing": {
            "field": "字段值"
        }
    }
}

实例如下

GET first-index/_search
{
  "query": {
    "exists": {
      "field": "age"
    }
  }
}

2.6 组合查询

上面都是单个查询条件，单我们需要多个查询条件组合使用时，可以使用bool + must/must_not/should来实现

查询语法

{
    "query": {
        "bool": {
            "must": [ # 相当于and查询
                "查询条件1",
                "查询条件2"
            ],
            "must_not": [ # 多个查询条件相反匹配，相当与not
                ...
            ],
            "should": [ # 有一个匹配即可， 相当于or
                ...
            ]
        }
    }
}

实例如下

## user.id = yihui and age < 20
GET first-index/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "user.id": {
              "value": "yihui"
            }
          }
        },
        {
          "range": {
            "age": {
              "lt": 20
            }
          }
        }
      ]
    }
  }
}

# !(user.id) = yihui and !(age>20)
GET first-index/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "term": {
            "user.id": {
              "value": "yihui"
            }
          }
        },
        {
          "range": {
            "age": {
              "gt": 20
            }
          }
        }
      ]
    }
  }
}

# user.id = 'yihui' or age>20
GET first-index/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "user.id": {
              "value": "yihui"
            }
          }
        },
        {
          "range": {
            "age": {
              "gt": 20
            }
          }
        }
      ]
    }
  }
}

下面截图以 must_not 输出示意

说明

前面根据字段查询 existing 只能单个匹配，可以借助这里的组合来实现多个的判断

2.7 match 查询

最大的特点是它更适用于模糊查询，比如查询某个 field 中的字段匹配

语法

{
    "query": {
        "match": {
            "字段名": "查询值"
        }
    }
}

举例说明

GET first-index/_search
{
  "query": {
    "match": {
      "user.name": "灰og"
    }
  }
}

说明，如果有精确查询的需求，使用前面的 term，可以缓存结果

2.8 multi_match 查询

更多相关信息，可以查看: 官网-multi_match 查询

多个字段中进行查询

语法

type: best_fields 、 most_fields 和 cross_fields （最佳字段、多数字段、跨字段）
最佳字段 ：当搜索词语具体概念的时候，比如 “brown fox” ，词组比各自独立的单词更有意义
多数字段：为了对相关度进行微调，常用的一个技术就是将相同的数据索引到不同的字段，它们各自具有独立的分析链。
混合字段：对于某些实体，我们需要在多个字段中确定其信息，单个字段都只能作为整体的一部分

{
    "query": {
        "multi_match": {
            "query":                "Quick brown fox",
            "type":                 "best_fields",
            "fields":               [ "title", "body" ],
            "tie_breaker":          0.3,
            "minimum_should_match": "30%"
        }
    }
}

实例演示

GET first-index/_search
{
  "query": {
    "multi_match": {
      "query": "汉",
      "fields": ["user.id", "addr.city"]
    }
  }
}

上面除了写上精确的字段之外，还支持模糊匹配，比如所有字段中进行匹配

GET first-index/_search
{
  "query": {
    "multi_match": {
      "query": "blog",
      "fields": ["*"]
    }
  }
}

2.9 wildcard 查询

shell 统配符

?: 0/1 个字符
*: 0/n 个字符

GET first-index/_search
{
  "query": {
    "wildcard": {
      "user.id": {
        "value": "*Hu?"
      }
    }
  }
}

说明，对中文可能有问题

2.10 regexp 查询

正则匹配

GET first-index/_search
{
  "query": {
    "regexp": {
      "user.name": ".*log"
    }
  }
}

2.11 prefix 查询

前缀匹配

GET first-index/_search
{
  "query": {
    "prefix": {
      "user.name": "一"
    }
  }
}

2.12 排序

查询结果排序，根据 sort 来指定

{
	"sort": [
        {
          "成员变量": {
            "order": "desc"
          }
        }
  	]
}

实例如下

GET first-index/_search
{
  "query":{
    "match_all": {}
  },
  "sort": [
    {
      "@timestamp": {
        "order": "desc"
      }
    }
  ]
}

2.13 更多

更多操作姿势，可以在官方文档上获取

官方教程

3. 删除文档

需要根据文档 id 进行指定删除

DELETE first-index/_doc/gPYLh3gBF9fSFsHNEe58

删除成功

4.更新文档

4.1 覆盖更新

使用 PUT 来实现更新，同样通过 id 进行

覆盖更新
version 版本会+1
如果 id 对应的文档不存在，则新增

PUT first-index/_doc/f_ZFhngBF9fSFsHNte7f
{
  "age": 28
}

4.2 增量更新

采用 POST 来实现增量更新

field 存在，则更新
field 不存在，则新增

POST first-index/_update/gvarh3gBF9fSFsHNuO49
{
  "doc": {
    "age": 25
  }
}

此外还可以采用 script 脚本更新

在原来的 age 基础上 + 5

POST first-index/_update/gvarh3gBF9fSFsHNuO49
{
  "script": "ctx._source.age += 5"
}

II. 其他

1. 一灰灰 Blog： https://liuyueyi.github.io/hexblog

一灰灰的个人博客，记录所有学习和工作中的博文，欢迎大家前去逛逛

2. 声明

尽信书则不如，以上内容，纯属一家之言，因个人能力有限，难免有疏漏和错误之处，如发现 bug 或者有更好的建议，欢迎批评指正，不吝感激

微博地址: 小灰灰 Blog
QQ：一灰灰/3302797840

3. 扫描关注

一灰灰 blog

QrCode

相关阅读:
你是一直认为 count(1) 比 count(*) 效率高么？
秒杀系统是如何防止超卖的？
百亿流量微服务网关的设计与实现
 中台
 Token 、Cookie、Session
HyperLedger Fabric 1.4 区块链应用场景（3.1）
HyperLedger Fabric 1.4 区块链工作过程（2.3）
HyperLedger Fabric 1.4 区块链技术原理（2.2）
HyperLedger Fabric 1.4 区块链技术定义（2.1）
HyperLedger Fabric 1.4 区块链技术发展（1.3）
原文地址：https://www.cnblogs.com/yihuihui/p/14634295.html