• ElasticSearch 笔记(二)


    记录一些核心概念

    1) Near Realtime (NRT): 近实时,包括 2 个方面,① 数据从写入 Elasticsearch 到可被搜索、分析的延迟 ( 大约 1 秒 ); ② 从 es 中搜索数据、分析数据,秒级别。

    2) Cluster: 集群,每个集群有一个名字,默认为 "elasticsearch", 每个集群包含多个节点。

    3) Node: 节点,每个节点有一个名字,默认是随机生成的,每个节点属于一个 Cluster ( 集群 ), 默认会加入一个名为 "elasticsearch" 的集群。

    4) Document: 文档,es 中最小的数据单元,一个 Document 类似 MySQL 的一条记录,包含多个 Field (字段)。

    5) Index: 索引,类似 MySQL 的库,包含多个 Document。

    6) Type: 类型,类似 MySQL 的表。Type 是 Index 里的数据逻辑分类,同一个 Type 下的 Document 应拥有同样的 Field。

    7) shard: 分片,全称是 primary shard,类似 MySQL 的分库。每个 shard 都是一个 lucene index。完整的建立索引和处理请求的能力。

                   比如现在有 2GB 的数据,每台机器只能容纳 1GB,就需要把数据分配到 2 台机器上处理。

                   一个 Index 的 shard 数量在创建时配置,不可修改。Elasticsearch 默认创建 5 个 shard。

                   shard 让我们可以很方便的横向扩展,比如现在数据量到了 3GB,那么重新创建一个 3 shard 的 Index 便是。

                   shard 把数据分配到多台机器,提高并发吞吐量。

    8) replica: 副本,全称是 replica shard,类似 MySQL 的从库。是 primary shard 的副本。每个 shard 默认创建 1 个 replica。

                    replica 让 Elasticsearch 高可用。同时,"读请求" 可以直接读 replica,提高并发吞吐量。

  • 相关阅读:
    python将阿拉伯数字转换为中文书写的数字形式
    python生成textgrid文件
    将 Nodejs 服务部署到阿里云服务器
    盛最多水的容器
    连续子数组的最大和
    数组中出现次数超过一半的数字
    变态跳台阶
    二进制中 1 的个数
    784.字母大小写全排列
    链表中环的入口节点
  • 原文地址:https://www.cnblogs.com/justmehyp/p/10076810.html
Copyright © 2020-2023  润新知