新建和删除 Index
新建 Index,可以直接向 Elastic 服务器发出 PUT 请求。下面的例子是新建一个名叫weather
的 Index。
curl -XPUT http://192.168.239.101:9200/weather/
服务器返回一个 JSON 对象,里面的acknowledged
字段表示操作成功。
{ "acknowledged":true, "shards_acknowledged":true }
然后,我们发出 DELETE 请求,删除这个 Index。
$ curl -X DELETE http://192.168.239.101:9200/weather
数据操作
5.1 新增记录
向指定的 /Index/Type 发送 PUT 请求,就可以在 Index 里面新增一条记录。比如,向/accounts/person
发送请求,就可以新增一条人员记录。
curl -X PUT http://192.168.239.101:9200/accounts/person -d ' { "user": "张三", "title": "工程师", "desc": "数据库管理" }'
服务器返回的 JSON 对象,会给出 Index、Type、Id、Version 等信息。
{ "_index":"accounts", "_type":"person", "_id":"1", "_version":1, "result":"created", "_shards":{"total":2,"successful":1,"failed":0}, "created":true }
如果你仔细看,会发现请求路径是/accounts/person/1
,最后的1
是该条记录的 Id。它不一定是数字,任意字符串(比如abc
)都可以。
新增记录的时候,也可以不指定 Id,这时要改成 POST 请求。
curl -X POST http://192.168.239.101:9200/accounts/person -d ' { "user": "李四", "title": "工程师", "desc": "系统管理" }'
上面代码中,向/accounts/person
发出一个 POST 请求,添加一个记录。这时,服务器返回的 JSON 对象里面,_id
字段就是一个随机字符串。
{ "_index":"accounts", "_type":"person", "_id":"AV3qGfrC6jMbsbXb6k1p", "_version":1, "result":"created", "_shards":{"total":2,"successful":1,"failed":0}, "created":true }
注意,如果没有先创建 Index(这个例子是accounts
),直接执行上面的命令,Elastic 也不会报错,而是直接生成指定的 Index。所以,打字的时候要小心,不要写错 Index 的名称。
5.2 查看记录
向/Index/Type/Id
发出 GET 请求,就可以查看这条记录。
curl -XGET http://192.168.239.101:9200/accounts/person/1?pretty
上面代码请求查看/accounts/person/1
这条记录,URL 的参数pretty=true
表示以易读的格式返回。
返回的数据中,found
字段表示查询成功,_source
字段返回原始记录。
{ "_index" : "accounts", "_type" : "person", "_id" : "1", "_version" : 1, "found" : true, "_source" : { "user" : "张三", "title" : "工程师", "desc" : "数据库管理" } }
如果 Id 不正确,就查不到数据,found
字段就是false
。
curl -XGET http://192.168.239.101:9200/accounts/person/1?pretty { "_index" : "accounts", "_type" : "person", "_id" : "1", "found" : false }
5.3 删除记录
删除记录就是发出 DELETE 请求。
curl -X DELETE 'http://192.168.239.101:9200/accounts/person/AWjP8cuP2r1J3ImKYMiA'
5.4 更新记录
更新记录就是使用 PUT 请求,重新发送一次数据。
curl -X PUT http://192.168.239.101:9200/accounts/person/1 -d ' { "user": "李四", "title": "工程师", "desc": "数据库管理" }'
curl -X PUT http://192.168.239.101:9200/accounts/person/1 -d ' > { > "user": "李四", > "title": "工程师", > "desc": "数据库管理" > }' {"_index":"accounts","_type":"person","_id":"1","_version":2,"_shards":{"total":2,"successful":2,"failed":0},"created":false}
上面代码中,我们将原始数据从"数据库管理"改成"数据库管理,软件开发"。 返回结果里面,有几个字段发生了变化。
"_version" : 2, "result" : "updated", "created" : false
可以看到,记录的 Id 没变,但是版本(version)从1
变成2
,操作类型(result)从created
变成updated
,created
字段变成false
,因为这次不是新建记录。
数据查询
返回所有记录
使用 GET 方法,直接请求/Index/Type/_search
,就会返回所有记录。
curl http://192.168.239.101:9200/accounts/person/_search?pretty { "took" : 5, "timed_out" : false, "_shards" : { "total" : 5, "successful" : 5, "failed" : 0 }, "hits" : { "total" : 2, "max_score" : 1.0, "hits" : [ { "_index" : "accounts", "_type" : "person", "_id" : "2", "_score" : 1.0, "_source" : { "user" : "十大的", "title" : "工程师", "desc" : "数据库管理" } }, { "_index" : "accounts", "_type" : "person", "_id" : "1", "_score" : 1.0, "_source" : { "user" : "李四", "title" : "工程师", "desc" : "数据库管理" } } ] } }
上面代码中,返回结果的 took
字段表示该操作的耗时(单位为毫秒),timed_out
字段表示是否超时,hits
字段表示命中的记录,里面子字段的含义如下。
total
:返回记录数,本例是2条。max_score
:最高的匹配程度,本例是1.0
。hits
:返回的记录组成的数组。
返回的记录中,每条记录都有一个_score
字段,表示匹配的程序,默认是按照这个字段降序排列。
全文搜索
Elastic 的查询非常特别,使用自己的查询语法,要求 GET 请求带有数据体。
curl 'http://192.168.239.101:9200/accounts/person/_search' -d ' { "query" : { "match" : { "desc" : "系统" }} }'
上面代码使用 Match 查询,指定的匹配条件是desc
字段里面包含"软件"这个词。返回结果如下。
{"took":11,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":0.2169777,"hits":[{"_index":"accounts","_type":"person","_id":"2","_score":0.2169777,"_source": { "user": "十大的", "title": "工程师", "desc": "系统管理" }}]}}
Elastic 默认一次返回10条结果,可以通过size
字段改变这个设置。
curl 'http://192.168.239.101:9200/accounts/person/_search' -d ' { "query" : { "match" : { "desc" : "系统" }}, "size": 1 }'
上面代码指定,每次只返回一条结果。
还可以通过from
字段,指定位移。
curl 'http://192.168.239.101:9200/accounts/person/_search' -d ' { "query" : { "match" : { "desc" : "系统" }}, "from": 1, "size": 1 }'
上面代码指定,从位置1开始(默认是从位置0开始),只返回一条结果。
逻辑运算
如果有多个搜索关键字, Elastic 认为它们是or
关系。
curl 'http://192.168.239.101:9200/accounts/person/_search?pretty' -d ' > { > "query" : { "match" : { "desc" : "数据 系统" }} > }' { "took" : 9, "timed_out" : false, "_shards" : { "total" : 5, "successful" : 5, "failed" : 0 }, "hits" : { "total" : 2, "max_score" : 0.03182549, "hits" : [ { "_index" : "accounts", "_type" : "person", "_id" : "2", "_score" : 0.03182549, "_source" : { "user" : "十大的", "title" : "工程师", "desc" : "系统管理" } }, { "_index" : "accounts", "_type" : "person", "_id" : "1", "_score" : 0.027847305, "_source" : { "user" : "李四", "title" : "工程师", "desc" : "数据库管理" } } ] } }
上面代码搜索的是数据 or 系统
。
对多个field发起查询:multi_match
curl -XGET http://192.168.239.101:9200/bjsxt/employee/_search?pretty -d ' { "query": {"multi_match": { "query":"bin", "fields":["last_name","first_name"], "operator":"and" } } }'
如果要执行多个关键词的and
搜索,必须使用布尔查询。
curl 'http://192.168.239.101:9200/accounts/person/_search?pretty' -d ' { "query": { "bool": { "must": [ { "match": { "desc": "软件" } }, { "match": { "desc": "系统" } } ] } } }'
#多个term对多个field发起查询:bool(boolean) # 组合查询,must,must_not,should # must + must : 交集 # must +must_not :差集 # should+should : 并集 curl -XGET http://192.168.239.101:9200/bjsxt/employee/_search?pretty -d ' { "query": {"bool" : { "must" : {"match": {"first_name":"bin"} }, "must" : {"match": {"age":33} } } } }' curl -XGET http://192.168.239.101:9200/bjsxt/employee/_search?pretty -d ' { "query": {"bool" : { "must" : {"match": {"first_name":"bin"} }, "must_not" : {"match": {"age":33} } } } }' curl -XGET http://192.168.239.101:9200/bjsxt/employee/_search?pretty -d ' { "query": {"bool" : { "must_not" : {"match": {"first_name":"bin"} }, "must_not" : {"match": {"age":33} } } } }' ##查询first_name=bin的,或者年龄在20岁到33岁之间的 curl -XGET http://192.168.239.101:9200/bjsxt/employee/_search -d ' { "query": {"bool" : { "must" : {"term" : { "first_name" : "bin" } } , "must_not" : {"range": {"age" : { "from" : 20, "to" : 33 } } } } } }'
修改配置
number_of_replicas 是数据备份数,如果只有一台机器,设置为0
number_of_shards 是数据分片数,默认为5,有时候设置为3
可以在线改所有配置的参数,number_of_shards不可以在线改
curl -XPUT 'http://192.168.239.101:9200/test3/' -d'{"settings":{"number_of_shards":3,"number_of_replicas":2}}'
该命令设置数据备份为2份,数据分片数为3。