Elasticsearch CRUD基本操作

Elasticsearch CRUD基本操作
前言
本次我们聊一聊Elasticsearch的基本操作CRUD，他跟我们常用的关系型数据库的操作又有什么不一样的地方呢？今天我们就来好好讲解一番。
目录
说明

本次演示用的版本是7.11。
工具可以使用Kibana的控制台，界面美观且有一定的缩进，而且能简化命令行的curl操作，如果对安装有问题的，可以看一下我之前的文章。

API约定

关系型数据库用的是SQL进行数据的访问，而Elasticsearch用的是REST进行数据的访问，HTTP的请求头PUT、GET、POST、DELETE正好可以对应CRUD（create、read、update、delete）四种数据操作。

数据的格式用的是JSON。

索引操作

创建索引

创建索引movie
```
PUT /movie
{
  "settings": {
    "index": {
      "number_of_shards": 1,
      "number_of_replicas": 0
    }
  }
}
```
number_of_shards是主分片数，number_of_replicas是一个主分片有多少个本，那么总的分片数就是“(number_of_replicas + 1) * number_of_shards”

查看索引
```
GET /movie/
```
删除索引
```
DELETE /movie/
```
文档操作

插入文档

7.x版本，type默认是“_doc”。可以用POST，也可以用PUT
```
// 自动生成_id
POST /movie/_doc
{
  "title": "The Pursuit of Happyness",
  "actors": [
    "Will Smith",
    "Jaden Smith",
    "Thandie Newton"
  ]
}

// 指定_id=1
PUT /movie/_doc/1
{
  "title": "The Pursuit of Happyness",
  "actors": [
    "Will Smith",
    "Jaden Smith",
    "Thandie Newton"
  ]
}

// 演示覆盖
PUT /movie/_doc/1
{
  "title": "xxx"
}
```
如果是指定_id的情况下（称为index操作），那么如果文档已经存在的话，会直接进行覆盖，也就是如果里面有些字段没传，那个字段就不会存储了，比如上面第三个请求，执行完后去获取“_id=1”的数据，只能获取到title字段，actors字段是不存在的。

更新文档

更新“_id=1”的数据，注意需要有“doc”。如果用“POST /movie/_update/1”这种语法，就直接覆盖了。
```
POST /movie/_update/1
{
  "doc":{
    "title": "The Pursuit of Happyness xxx"
  }
}
```
删除文档

删除“_id=1”的数据
```
DELETE /movie/_doc/1
```
获取文档

获取“_id=1”的数据
```
GET /movie/_doc/1
```
搜索文档
```
GET /movies/_search
{
  "profile": "true",
  "_source": ["movieId", "title","genres"], 
  "sort": [{"movieId": "desc"}],
  "from": 0,
  "size": 3,
  "query": {
    "match_all": {}
  }
}
```
- movies是之前导入的数据，非前面用的movie，需要测试的话要先导入一下数据。
- profile 相当于MySQL中的explain
- _source 是要返回的字段
上面的请求，类比SQL如下
```
select movieId, title, genres from movies order by movieId desc limit 0, 3
```
更复杂的搜索查询，后面持续更新。

批量文档操作

批量操作
```
POST movie/_bulk
{"index":{"_index":"movie","_id":1}}
{"title": "xxx xx"}
{"index":{"_index":"movie","_id":2}}
{"title": "The Pursuit of Happyness"}
{"update":{"_index":"movie","_id":2}}
{"doc":{"title": "xxx xx"}}
```
支持在一次API调用中，对不同的索引做不同的操作，减少网络请求的次数，提高性能。支持的操作有index、create、update、delete。批量操作，如果其中一条有错误没法执行，不会阻碍其他的请求，会继续执行下去。

请求体要特别注意一下，不能格式化，而且第一行指定index跟id，第二行指定数据，以此类推。

批量读取

请求体可以格式化
```
GET _mget
{
  "docs": [
    {
      "_index": "movie",
      "_id": 1
    },
    {
      "_index": "movie",
      "_id": 2
    }
  ]
}
```
如果是对同一个index进行操作，可以在URI指定index
```
GET movie/_mget
{
  "docs": [
    {
      "_id": 1
    },
    {
      "_id": 2
    }
  ]
```
批量查询
```
GET /movies/_msearch
{}
{"from":0,"size":1,"query":{"match_all":{}}}
{}
{"from":0,"size":2,"query":{"match_all":{}}}
```
与_bulk操作类似，不能进行格式化。
__EOF__

欢迎转载，但请注明出处！
欢迎大家一起交流学习！如果有什么疑问，大家可以在评论区一起交流！
如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。您的鼓励是我的最大动力！
相关阅读:
油管上有多乱！！！这就是美国所谓的“言论自由”
Gitee官网大规模封禁开源项目，如想解禁则需手动提交审核，在此过程中一些项目的信息也被gitee官方修改！！！
再探游戏《 2048 》 —— AI方法—— 缘起、缘灭（1） —— Firefox浏览器下自动运行游戏篇（续）
ubuntu环境下boost库的安装——Could NOT find Boost (missing: Boost_INCLUDE_DIR program_options) (Required is at least version "1.49.0")
【转载】 Makefile的静态模式%.o : %.c
任意界面调出微信的快捷键
 windows cmd切换目录
 w10 本地邮箱同步163，出现可能需要更新密码或授予账户同步到此设备的权限
 yaml有没有多行注释的方法
 笔记本电脑选购显示器
原文地址：https://www.cnblogs.com/powercto/p/14438907.html

Elasticsearch CRUD基本操作

说明

API约定

索引操作

创建索引

查看索引

删除索引

文档操作

插入文档

更新文档

删除文档

获取文档

搜索文档

批量文档操作

批量操作

批量读取

批量查询