• Elastic Stack:ElasticSearch核心概念


    ElasticSearch核心概念

    1 NRT(Near Realtime):近实时

    两方面:

    写入数据时,过1秒才会被搜索到,因为内部在分词、录入索引。

    es搜索时:搜索和分析数据需要秒级出结果。

    2 Cluster:集群

    包含一个或多个启动着es实例的机器群。通常一台机器起一个es实例。同一网络下,集名一样的多个es实例自动组成集群,自动均衡分片等行为。默认集群名为“elasticsearch”。

    3 Node:节点

    每个es实例称为一个节点。节点名自动分配,也可以手动配置。

    4 Document:文档

    es中的最小数据单元。一个document就像数据库中的一条记录。通常以json格式显示。多个document存储于一个索引(Index)中。

    {
      "book_id": "1",
      "book_name": "java编程思想",
      "book_desc": "从Java的基础语法到最高级特性(深入的[面向对象](https://baike.baidu.com/item/面向对象)概念、多线程、自动项目构建、单元测试和调试等),本书都能逐步指导你轻松掌握。",
      "category_id": "2",
      "category_name": "java"
    }
    

    5 Index:索引

    包含一堆有相似结构的文档数据。

    索引创建规则:

    • 仅限小写字母

    • 不能包含、/、 *、?、"、<、>、|、#以及空格符等特殊符号

    • 从7.0版本开始不再包含冒号

    • 不能以-、_或+开头

    • 不能超过255个字节(注意它是字节,因此多字节字符将计入255个限制)

    6 Field:字段

    就像数据库中的列(Columns),定义每个document应该有的字段。

    7 Type:类型

    每个索引里都可以有一个或多个type,type是index中的一个逻辑数据分类,一个type下的document,都有相同的field。

    注意:6.0之前的版本有type(类型)概念,type相当于关系数据库的表,ES官方将在ES9.0版本中彻底删除type。本教程typy都为_doc。

    8 shard:分片

    index数据过大时,将index里面的数据,分为多个shard,分布式的存储在各个服务器上面。可以支持海量数据和高并发,提升性能和吞吐量,充分利用多台机器的cpu。

    9 replica:副本

    在分布式环境下,任何一台机器都会随时宕机,如果宕机,index的一个分片没有,导致此index不能搜索。所以,为了保证数据的安全,我们会将每个index的分片经行备份,存储在另外的机器上。保证少数机器宕机es集群仍可以搜索。

    能正常提供查询和插入的分片我们叫做主分片(primary shard),其余的我们就管他们叫做备份的分片(replica shard)。

    es6默认新建索引时,5分片,2副本,也就是一主一备,共10个分片。所以,es集群最小规模为两台。

    elasticseacrch与mysql对比:

    mysql es
    数据库dataBase 索引index
    表table 索引type(index)
    行row 文档document
    列column 字段field
    约束schema 映射mapping

     

  • 相关阅读:
    【训练】9.13 训练赛
    【训练】9.12 训练赛
    【题录】CF#666 Div.2
    【题解】JSOI2009球队收益 / 球队预算
    【申明】——暂别博客园——
    【题解】CF#896 D-Nephren Runs a Cinema
    【题解】洛谷P4707重返现世
    [HNOI2012][BZOJ2732] 射箭 [二分+半平面交]
    平面几何-学习笔记
    [NOI.AC省选模拟赛3.31] 星辰大海 [半平面交]
  • 原文地址:https://www.cnblogs.com/wwjj4811/p/13051006.html
Copyright © 2020-2023  润新知