• Elasticsearch基础知识分享


    1. Elasticsearch背景介绍
      Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
    备注:
      (1) Lucene
      Lucene是一套用于全文检索的开放源代码程序库,同时也是最受欢迎的免费Java信息检索程序库。
      (2) RESTful
      RESTful是一种万维网软件架构风格,不是一种标准
      (3) Elasticsearch开箱即用,请在官网下载


    2. Elasticsearch相关概念及项目包介绍
     (一) 相关概念
      1、索引(index)
      ES中文档存储的地方就叫索引,也可以理解为数据库
      2、类型(type)
      文档归属于一种类型(type),而这些类型存在于索引(index)中,可以理解为数据库中的一张表
      3、文档(documents)
      可以理解为数据库中一行数据就是一个文档
      4、字段(File)
      可以理解为一行数据中的字段
      5、数据包含关系如下:Elasticsearch -> Indices -> Types -> Documents -> Fields
      6、分片(shard)
      Elasticsearch集群允许系统存储的数据量超过单机容量,实现这一目标引入分片策略shard。在一个索引index中,数据(document)被分片处理(sharding)到多个分片上。Elasticsearch屏蔽了管理分片的复杂性,使得多个分片呈现出一个大索引的样子。
      7、副本(replica)
      为了提升访问压力过大是单机无法处理所有请求的问题,Elasticsearch集群引入了副本策略replica。副本策略对index中的每个分片创建冗余的副本,处理查询时可以把这些副本当做主分片来对待(primary shard),此外副本策略提供了高可用和数据安全的保障,当分片所在的机器宕机,Elasticsearch可以使用其副本进行恢复,从而避免数据丢失。
      8、路由(routing)
      当向Elasticsearch存放数据时,根据文档标识符_id将文档分配到多个分片上,负载均衡算法只需要实现平均即可。当取用数据时,查询所有的分片然后汇总结果,而并不必须知道数据到底存在哪个分片上。带来的问题是,在查询时,要查询所有的分片然后汇总结果,造成性能的损耗,在不乐观的情况下,有些分片的查询可能失败(failed),造成结果不准确。为了避免这个问题,引入了路由功能(routing),在存入数据时通过路由键将数据存入指定分片,在查询的时候可以通过相同的路由键指明在哪个分片将数据查出来。

     (二) 目录介绍
      1、Bin 启动目录
      2、Config 配置目录
      3、Data 节点分片数据目录
      4、Lib jar包目录
      5、Logs 日志目录
      6、Plugins 工具目录


    3. Elasticsearch启动测试
     (一)启动
      1、es目录下进入bin目录下,点击 elasticsearch.bat
      2、es目录下命令行执行./bin/elasticsearch
     (二)测试
      1、es目录下命令行执行:curl 'http://localhost:9200/?pretty'
      2、浏览器访问地址:http://localhost:9200/_plugin/head/

    4. Elasticsearch命令行数据的增删改查
     (一)查询
      请求方式:curl 'localhost:9200/index/type/id?pretty'
      1、localhost:9200是ES的访问地址和端口
      2、index是索引的名称
      3、type是类型的名称
      4、pretty是将返回的信息以可读的JSON形式返回。
      搜索API
      1、请求参数方式:curl 'localhost:9200/index/_search?XXX'
      2、请求体方式:curl -XPOST 'localhost:9200/index/_search?pretty' -d 'XXX'
     (二)新增:curl -XPOST http://localhost:9200/index/type/id -d’{XXX}’
     (三)修改:与新增类似
     (四)删除:curl -XDELETE 'localhost:9200/index/type/id'
      备注:以上XXX指需要查询的内容
      以上就是简单的ES学习内容,当然这是很基础的知识,本人了解也有限,如果有什么问题请及时指出。当然最好的学习方式是参考ES官网文档,在我之前的博客也有提到过,学无止境,希望能与大家一起进步。

     

  • 相关阅读:
    关于PHP写的投票网站之刷票风云
    《暗战强人:黑客及反黑客工具快速精通》学习笔记
    《Linux信息安全实用教程》学习笔记
    MySql的入侵测试以及防范
    基于Sql Server 2008的分布式数据库的实践(终结)
    Sql Server的弱口令入侵测试以及防范
    IPC$ 测试与防范
    基于Sql Server 2008的分布式数据库的实践(五)
    基于Sql Server 2008的分布式数据库的实践(四)
    基于Sql Server 2008的分布式数据库的实践(三)
  • 原文地址:https://www.cnblogs.com/ZWOLF/p/10503370.html
Copyright © 2020-2023  润新知