• 集群操作


    rest接口

            

            现在我们已经有一个正常运行的节点(和集群)了,下一步就是要去理解怎样与其通信了。幸运的是,Elasticsearch提供了非常全面和强大的REST API,利用这个REST API你可以同你的集群交互。下面是利用这个API,可以做的几件事情:

            

                - 检查你的集群、节点和索引的健康状态、和各种统计信息

                - 管理你的集群、节点、索引数据和元数据

                - 对你的索引进行CRUD(创建、读取、更新和删除)和搜索操作

                - 执行高级的查询操作,像是分页、排序、过滤、脚本编写(scripting)、小平面刻画(faceting)、聚合(aggregations)和许多其它操作

               

               

        集群健康

        

            让我们以基本的健康检查作为开始,我们可以利用它来查看我们集群的状态。此过程中,我们使用curl,当然,你也可以使用任何可以创建HTTP/REST调用的工具。我们假设我们还在我们启动Elasticsearch的节点上并打开另外一个shell窗口。

            

            要检查集群健康,我们将使用_cat API。需要事先记住的是,我们的节点HTTP的端口是9200

            

                curl 'localhost:9200/_cat/health?v'

            

            相应的响应是:

            

                epoch      timestamp cluster       status node.total node.data shards pri relo init unassign

                1394735289 14:28:09  elasticsearch green           1         1      0   0    0    0        0

                

            可以看到,我们集群的名字是elasticsearch”,正常运行,并且状态是绿色。

            

            当我们询问集群状态的时候,我们要么得到绿色、黄色或红色。绿色代表一切正常(集群功能齐全),黄色意味着所有的数据都是可用的,但是某些复制没有被分配(集群功能齐全),红色则代表因为某些原因,某些数据不可用。注意,即使是集群状态是红色的,集群仍然是部分可用的(它仍然会利用可用的分片来响应搜索请求),但是可能你需要尽快修复它,因为你有丢失的数据。

            

            也是从上面的响应中,我们可以看到,一共有一个节点,由于里面没有数据,我们有0个分片。注意,由于我们使用默认的集群名字(elasticsearch),并且由于Elasticsearch默认使用网络多播(multicast)发现其它节点,如果你在你的网络中启动了多个节点,你就已经把她们加入到一个集群中了。在这种情形下,你可能在上面的响应中看到多个节点。

            

            我们也可以获得节集群中的节点列表:

                

                curl 'localhost:9200/_cat/nodes?v'

                

            对应的响应是:

            

                curl 'localhost:9200/_cat/nodes?v'

                host         ip        heap.percent ram.percent load node.role master name

                mwubuntu1    127.0.1.1            8           4 0.00 d         *      New Goblin

            

            这儿,我们可以看到我们叫做New Goblin”的节点,这个节点是我们集群中的唯一节点。

            

            

        列出所有的索引

            让我们看一下我们的索引:

                

                curl 'localhost:9200/_cat/indices?v'

                

            响应是:

                

                curl 'localhost:9200/_cat/indices?v'

                health index pri rep docs.count docs.deleted store.size pri.store.size

                

            这个结果意味着,在我们的集群中,我们没有任何索引。

            

            

        创建一个索引

        

            现在让我们创建一个叫做customer”的索引,然后再列出所有的索引:

            

                curl -XPUT 'localhost:9200/customer?pretty'

                curl 'localhost:9200/_cat/indices?v'

            

            第一个命令使用PUT创建了一个叫做“customer”的索引。我们简单地将pretty附加到调用的尾部,使其以美观的形式打印出JSON响应(如果有的话)。

            响应如下:

            

                curl -XPUT 'localhost:9200/customer?pretty'

                {

                  "acknowledged" : true

                }

     

     

                curl 'localhost:9200/_cat/indices?v'

                health index    pri rep docs.count docs.deleted store.size pri.store.size

                yellow customer   5   1          0            0       495b           495b

                

            第二个命令的结果告知我们,我们现在有一个叫做customer的索引,并且它有5个主分片和1份复制(都是默认值),其中包含0个文档。

            

            你可能也注意到了这个customer索引有一个黄色健康标签。回顾我们之前的讨论,黄色意味着某些复制没有(或者还未)被分配。这个索引之所以这样,是因为Elasticsearch默认为这个索引创建一份复制。由于现在我们只有一个节点在运行,那一份复制就分配不了了(为了高可用),直到当另外一个节点加入到这个集群后,才能分配。一旦那份复制在第二个节点上被复制,这个节点的健康状态就会变成绿色。

            

     

     

    索引并查询一个文档

        现在让我们放一些东西到customer索引中。首先要知道的是,为了索引一个文档,我们必须告诉Elasticsearch这个文档要到这个索引的哪个类型(type)下。

        

        让我们将一个简单的客户文档索引到customer索引、“external”类型中,这个文档的ID1,操作如下:

            

            curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '

            {

              "name": "John Doe"

            }'

            

        响应如下:

        

            curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '

            {

              "name": "John Doe"

            }'

            {

              "_index" : "customer",

              "_type" : "external",

              "_id" : "1",

              "_version" : 1,

              "created" : true

            }

            

        从上面的响应中,我们可以看到,一个新的客户文档在customer索引和external类型中被成功创建。文档也有一个内部id 1, 这个id是我们在索引的时候指定的。

        

        有一个关键点需要注意,Elasticsearch在你想将文档索引到某个索引的时候,并不强制要求这个索引被显式地创建。在前面这个例子中,如果customer索引不存在,Elasticsearch将会自动地创建这个索引。

        

        现在,让我们把刚刚索引的文档取出来:

        

            curl -XGET 'localhost:9200/customer/external/1?pretty'

            

        响应如下:

        

            curl -XGET 'localhost:9200/customer/external/1?pretty'

            {

              "_index" : "customer",

              "_type" : "external",

              "_id" : "1",

              "_version" : 1,

              "found" : true, "_source" : { "name": "John Doe" }

            }

            

        除了一个叫做found的字段来指明我们找到了一个ID1的文档,和另外一个字段——_source——返回我们前一步中索引的完整JSON文档之外,其它的都没有什么特别之处。

        

        

    删除一个文档

        

        现在让我们删除我们刚刚创建的索引,并再次列出所有的索引:

        

            curl -XDELETE 'localhost:9200/customer?pretty'

            curl 'localhost:9200/_cat/indices?v'

            

        响应如下:

        

            curl -XDELETE 'localhost:9200/customer?pretty'

            {

              "acknowledged" : true

            }

            curl 'localhost:9200/_cat/indices?v'

            health index pri rep docs.count docs.deleted store.size pri.store.size

            

        这表明我们成功地删除了这个索引,现在我们回到了集群中空无所有的状态。

        

        在更进一步之前,我们再细看一下一些我们学过的API命令:

            

            curl -XPUT 'localhost:9200/customer'

            curl -XPUT 'localhost:9200/customer/external/1' -d '

            {

              "name": "John Doe"

            }'

            curl 'localhost:9200/customer/external/1'

            curl -XDELETE 'localhost:9200/customer'

            

        如果我们仔细研究以上的命令,我们可以发现访问Elasticsearch中数据的一个模式。这个模式可以被总结为:

        

            curl -<REST Verb> <Node>:<Port>/<Index>/<Type><ID>

            

        这个REST访问模式普遍适用于所有的API命令,如果你能记住它,你就会为掌握Elasticsearch开一个好头。

        

     

     

    修改你的数据

     

     

        Elasticsearch提供了近乎实时的数据操作和搜索功能。默认情况下,从你索引/更新/删除你的数据动作开始到它出现在你的搜索结果中,大概会有1秒钟的延迟。这和其它类似SQL的平台不同,数据在一个事务完成之后就会立即可用。

        

        索引/替换文档

            

            我们先前看到,怎样索引一个文档。现在我们再次调用那个命令:

                curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '

                {

                  "name": "John Doe"

                }'

                

            再次,以上的命令将会把这个文档索引到customer索引、external类型中,其ID1。如果我们对一个不同(或相同)的文档应用以上的命令,Elasticsearch将会用一个新的文档来替换(重新索引)当前ID1的那个文档。

            

                curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '

                {

                  "name": "Jane Doe"

                }'

                

            以上的命令将ID1的文档的name字段的值从“John Doe”改成了“Jane Doe”。如果我们使用一个不同的ID,一个新的文档将会被索引,当前已经在索引中的文档不会受到影响。

            

                curl -XPUT 'localhost:9200/customer/external/2?pretty' -d '

                {

                  "name": "Jane Doe"

                }'

                

            以上的命令,将会索引一个ID2的新文档。

            

            在索引的时候,ID部分是可选的。如果不指定,Elasticsearch将产生一个随机的ID来索引这个文档。Elasticsearch生成的ID会作为索引API调用的一部分被返回。

            

            以下的例子展示了怎样在没有指定ID的情况下来索引一个文档:

            

                curl -XPOST 'localhost:9200/customer/external?pretty' -d '

                {

                  "name": "Jane Doe"

                }'

                

            注意,在上面的情形中,由于我们没有指定一个ID,我们使用的是POST而不是PUT

     

     

     

     

    更新文档

        

        除了可以索引、替换文档之外,我们也可以更新一个文档。但要注意,Elasticsearch底层并不支持原地更新。在我们想要做一次更新的时候,Elasticsearch先删除旧文档,然后在索引一个更新过的新文档。

        

        下面的例子展示了怎样将我们ID1的文档的name字段改成“Jane Doe”:

        

            curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '

            {

              "doc": { "name": "Jane Doe" }

            }'

            

        下面的例子展示了怎样将我们ID1的文档的name字段改成“Jane Doe”的同时,给它加上age字段:

        

            curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '

            {

              "doc": { "name": "Jane Doe", "age": 20 }

            }'

            

        更新也可以通过使用简单的脚本来进行。这个例子使用一个脚本将age5

        

            curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '

            {

              "script" : "ctx._source.age += 5"

            }'

            

        在上面的例子中,ctx._source指向当前要被更新的文档。

        

        注意,在写作本文时,更新操作只能一次应用在一个文档上。将来,Elasticsearch将提供同时更新符合指定查询条件的多个文档的功能(类似于SQLUPDATE-WHERE语句)。

        

     

     

    删除文档

        

        删除文档是相当直观的。以下的例子展示了我们怎样删除ID2的文档:

        

            curl -XDELETE 'localhost:9200/customer/external/2?pretty'

        

        我们也能够一次删除符合某个查询条件的多个文档。以下的例子展示了如何删除名字中包含John”的所有的客户:

        

            curl -XDELETE 'localhost:9200/customer/external/_query?pretty' -d '

            {

              "query": { "match": { "name": "John" } }

            }'

            

    注意,以上的URI变成了/_query,以此来表明这是一个“查询删除”API,其中删除查询标准放在请求体中,但是我们仍然使用DELETE。现在先不要担心查询语法,我们将会在本教程后面的部分中涉及。

  • 相关阅读:
    对象方法Android之多媒体使用——MediaPlayer播放音频
    程序函数C语言中异常处理的两个函数
    退出窗口[置顶] 退出Activity的方法
    循环变量hdu 1799 循环多少次?
    网页剪辑有道云笔记、印象笔记(evernote)哪个更好?
    选项选择Windows XP系统安装MySQL5.5.28图解
    修改nullMyEclipse 设置文件的默认编码
    文件应用iOS开发用keychain替代UDID
    模块执行python模块介绍 struct 二进制数据结构
    数据库字符串AVP(AttributeValue Pair)
  • 原文地址:https://www.cnblogs.com/13224ACMer/p/6762717.html
Copyright © 2020-2023  润新知