• 分布式搜索引擎ElasticSearch介绍


    1、Lucene, Solr, ElasticSearch的关系

    Lucene是类库(Java开发)

    Solr基于lucene(Java开发)

    ES基于lucene (支持PB级别的查询 PB=1024T)

    2、ES核心术语与数据库的对应

    ES核心术语                       数据库

    索引index                           表

    类型type(7.3版本弃用)      表逻辑类型

    文档document      行

    字段 fields       列 

    映射mapping      表结构定义

    近实时NRT(1秒左右)       Near real time(近实时的搜索)

    节点node          每一个服务器

    shared replica      数据备份和分片

    3、集群相关
    分片(shard):把索引库拆分为多份,分别放在不同的节点上,比如有3个节点,3个节点的所有数据内容加在一起是一个完整的索引库。分别保存到三个节点上
    水平扩展,提高吞吐量。
    备份(replica):每个shard的备份。
    简称
    shard = primary shard(主分片)
    replica = replica shard(备份节点)
     
    ES集群架构原理

    4、倒排索引

    倒排索引源于实际应用中需要根据属性的值来查记录。这种索引表中的每一项都包含一个属性值和包含该属性值的各个记录地址。由于不是根据记录来确定属性,

    而是根据属性来确定记录的位置,所有称之为倒排索引。

  • 相关阅读:
    作业九 主成分分析
    作业八 特征选择
    作业七 逻辑回归应用
    作业六 逻辑回归
    作业五 线性回归算法
    第十四次作业:手写数字识别-小数据集
    第十三次作业:深度学习-卷积
    第七次作业:7.逻辑回归实践
    第十二次作业:垃圾邮件分类2
    第十一次作业:朴素贝叶斯-垃圾邮件分类
  • 原文地址:https://www.cnblogs.com/linlf03/p/12770317.html
Copyright © 2020-2023  润新知