• ElasticSearch 交互使用


    Curl 命令

    # 建立索引
    [root@dbtest01 ~]# curl -XPUT 'http://10.0.0.121:9200/test'
    
    # 插入数据
    [root@dbtest01 ~]# curl -XPUT 'localhost:9200/student/user/1?pretty' -H 'Content-Type: application/json' -d '{"name": "wqh","gender":"male","age":"18","about":"I will carry you","interests":["cs","it"]}'
    

    ES-Head 插件

    谷歌浏览器安装 ES-Head 插件,点击下载
    将解压后的文件夹拖入谷歌浏览器扩展程序界面即可

    部署 Kibana

    安装 Kibana

    # 上传代码包
    [root@dbtest01 ~]# rz kibana-6.6.0-x86_64.rpm
    
    # 安装
    [root@dbtest01 ~]# rpm -ivh kibana-6.6.0-x86_64.rpm
    

    配置 Kibana

    [root@dbtest01 ~]# vim /etc/kibana/kibana.yml
    
    [root@dbtest01 ~]# grep "^[a-Z]" /etc/kibana/kibana.yml
    # 进程的端口
    server.port: 5601
    # 监听地址
    server.host: "10.0.0.121"
    # 指定 ES 地址
    elasticsearch.hosts: ["http://127.0.0.1:9200"]
    # Kibana 也会创建索引
    kibana.index: ".kibana"
    

    启动 Kibana

    # 启动 Kibana
    [root@dbtest01 ~]# systemctl start kibana.service
    
    # 验证
    [root@dbtest01 ~]# netstat -lntp       
    tcp        0      0 10.0.0.121:5601          0.0.0.0:*               LISTEN      88636/node
    

    浏览器访问页面

    # 访问 http://10.0.0.121:5601 , Kibana 启动速度较慢
    

    ElasticSearch 数据操作

    创建索引

    # 语法:
    PUT /<index>
    
    # 示例:
    PUT /laowang
    PUT xiaowang
    

    创建数据

    ES 存储数据三个必要构成条件,每一条数据必须有以下的数据结构,

    构成条件 说明
    _index 索引(数据存储的地方)
    _type 类型(数据对应的类)
    _id 数据唯一标识符
    # 语法
    PUT /<index>/_doc/<_id>
    POST /<index>/_doc/
    PUT /<index>/_create/<_id>
    POST /<index>/_create/<_id>
    
    index:索引名称,如果索引不存在,会自动创建
    _doc:类型
    <_id>:唯一识别符,创建一个数据时,可以自定义ID,也可以让他自动生成
    

    指定 ID 插入数据(PUT)

    PUT /student/user/3
    {
      "name": "zzz",
      "gender": "male",
      "age": "23",
      "about": "abcdefg",
      "interests": [
        "sturdy",
        "dddddd"
      ]
    }
    
    # 一般不用此方式插入数据
    # —— 需要修改 ID 值
    # —— 当指定 ID 时,插入数据时会查询数据对比 ID 值,若 ID 相同,则会覆盖更新原来的数据
    

    随机 ID 插入数据(POST)

    # ES 会随机生成一个较长字符串作为此条数据的唯一 ID 标识
    POST /student/user/
    {
      "name":"xiaoliu",
      "gender":"female"
    }
    

    添加指定字段

    # 推荐使用方法
    POST /student/user/
    {
      "id":"1",
      "name":"xiaoliu",
      "gender":"female"
    }
    

    查询数据

    简单查询

    # 查看所有索引信息
    GET /_all
    GET _all
    
    # 查看所有索引的数据
    GET /_all/_search
    
    # 查看指定索引信息
    GET /student
    
    # 查看指定索引的数据
    GET /student/_search
    
    # 查看指定数据
    GET /student/user/1
    

    条件查询(Term,Match)

    ①. — term 代表完全匹配,也就是精确查询,搜索前不会再对搜索词进行分词,例如,我们要搜索标题(title)为 "北京烤鸭" 的所有文档:

    # 方法一:
    GET /news/_search
    {
      "query": {
        "term": {			    
          "title": {
            "value": "北京烤鸭"
          }
        }
      }
    }
    
    # 可以省略 value 行,与 Key 合并到一行
    GET /news/_search
    {
      "query": {
        "term": {		       <-------- 使用 term 匹配,适用于精确查找
          "title":"北京烤鸭"        <------- 简写,并为一行
        }
      }
    }
    

    ②. — match 代表模糊匹配,先对搜索词进行分词,例如,我们要搜索标题(title)为 "北京烤鸭" 的文档时,会先将 "北京烤鸭" 分词为 "北京" 和 "烤鸭",符合两者其一的,都会取到结果:

    # 方法二:
    GET /news/_search
    {
      "query": {
        "match": {			<-------- 使用 match 匹配,适用于模糊查找
          "title": "北京烤鸭"
        }
      }
    }
    

    多条件查询(Bool)

    Bool 查询现在包括四种子句:must,filter,should,must_not
    ①. — must 查询:查询条件必须全部满足,类似 SELECT 语句中 的 AND:

    # 查询条件必须全部满足
    GET /student/_search
    {
      "query": {
        "bool": {
          "must": [
            {
              "term": {
                "age": {
                  "value": "23"
                }
              }
            },
            {
              "term": {
                "name": {
                  "value": "wqh"
                }
              }
            }
          ]
        }
      }
    }
    

    ②. — filter 查询:查询条件必须全部满足,类似 SELECT 语句中的 AND,与 must 不同的是,不会计算相关性分数:

    # 跟 must 一样,在数据量很大时,比 must 查询快一点,因为不用计算相关分
    GET /student/_search
    {
      "query": {
        "bool": {
          "filter": [
            {
              "term": {
                "age": {
                  "value": "23"
                }
              }
            },
            {
              "term": {
                "name": {
                  "value": "wqh"
                }
              }
            }
          ]
        }
      }
    }
    

    ③. — should 查询:查询条件满足其一即可,类似 SELECT 语句中的 OR,会计算相关性分数:

    # 多条件查询时,查询条件只要有一个满足就可以
    GET /student/_search
    {
      "query": {
        "bool": {
          "should": [
            {
              "term": {
                "age": {
                  "value": "23"
                }
              }
            },
            {
              "term": {
                "name": {
                  "value": "wqh"
                }
              }
            }
          ]
        }
      }
    }
    

    ④. — must_not 查询:查询条件必须不满足,类似 SELECT 语句中的 NOT,会计算相关性分数 :

    # must_not 中的条件,必须全部不满足
    GET /student/_search
    {
      "query": {
        "bool": {
          "must_not": [
            {
              "term": {
                "age": {
                  "value": "23"
                }
              }
            },
            {
              "term": {
                "name": {
                  "value": "wqh"
                }
              }
            }
          ]
        }
      }
    }
    

    ⑤. — must + should 查询:

    # 查询年龄是 23岁 或者年龄是 18岁 并且名字是 wqh 的数据
    GET /student/_search
    {
      "query": {
        "bool": {
          "should": [
            {
              "term": {
                "age": {
                  "value": "23"
                }
              }
            },
            {
              "bool": {
                "must": [
                  {
                    "term": {
                      "age": {
                        "value": "18"
                      }
                    }
                  },
                  {
                    "term": {
                      "name": {
                        "value": "xiaozi"
                      }
                    }
                  }
                ]
              }
            }
          ]
        }
      }
    }
    
    

    ⑥. — 范围查询:

    GET /student/_search
    {
      "query": {
        "bool": {
          "must": [
            {
              "range": {
                "age": {
                  "gte": 20,
                  "lte": 25
                }
              }
            }
          ]
        }
      }
    }
    

    修改数据

    # 修改数据时指定 ID 修改
    PUT /student/user/1
    {
      "name":"雾山火行",
      "gender":"male",
      "age":"18"
    }
    
    # 注意,修改数据时,除了要修改的值,其他字段的值也要带上,否则原有的其他字段会丢失
    PUT /student/user/2
    {
      "name":"wqh",
      "gender":"male",
      "age":"19"
    }
    

    删除数据

    # 删除指定 ID 数据
    DELETE /student/user/4
    
    # 删除索引(别瞎删,可以用 ES-head 关闭索引)
    DELETE /student
    

    Query Context(不带 Filter) 与 Filter Context

    ①. — Query Context 即指所有不使用 Bool 查询中的 Filter(过滤器)的上下文查询

    ②. — Filter Context 指 Bool 查询中,使用 Filter(过滤器)的上下文查询

    查询在 Query 查询上下文和 Filter 过滤器上下文中,执行的操作是不一样的:

    ①. — 查询上下文:是在使用 query 进行查询时的执行环境,比如使用 search 的时候。
    在查询上下文中,查询会回答这个问题——“这个文档是否匹配,它的相关度高么?
    ES中索引的数据都会存储一个 _score 分值,分值越高就代表越匹配。即使 lucene 使用倒排索引,对于某个搜索的分值计算还是需要一定的时间消耗 。

    ②. — 过滤器上下文:在使用 filter 参数时候的执行环境,比如在 bool 查询中使用 Must_not 或者 filter
    在过滤器上下文中,查询会回答这个问题——“这个文档是否匹配?
    它不会去计算任何分值,也不会关心返回的排序问题,因此效率会高一点。
    另外,经常使用过滤器,ES会自动的缓存过滤器的内容,这对于查询来说,会提高很多性能。

    总而言之:
    ①. — 查询上下文:查询操作不仅仅会进行查询,还会计算分值,用于确定相关度;

    ②. — 过滤器上下文:查询操作仅判断是否满足查询条件,不会计算得分,查询的结果可以被缓存,所以速度快

    所以,根据实际的需求是否需要获取得分,考虑性能因素,选择不同的查询子句;如果不需要获得查询词条的相关性分数,尽量使用 Filter 。

    参考:

    Bool 查询
    Query 与 Filter 的区别

  • 相关阅读:
    扩展欧几里得算法
    单源最短路径—Dijkstra算法
    欧拉定理,费马小定理
    欧拉函数
    Trie 字典树
    平衡树——Treap,Splay
    NOI2009 开关
    银河英雄传说
    线段树与延迟标记
    c++常见变量的极值
  • 原文地址:https://www.cnblogs.com/zzzwqh/p/13476764.html
Copyright © 2020-2023  润新知