• es倒排索引原理解析


    倒排索引原理

           

       

       普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容  如果用这样的方式查找   当需要查找某个单词的时候需要遍历所有的文档集合

       查找文档的效率会非常的慢

       2.基本倒排索引:

            在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储

            并且在最后一列保存这个被切分后的单词出现的文档编号的集合

       

          

        3.完善的倒排索引

        

    分词原理

        1.写时分词

          

        2.读时分词

         

        

        es对文本内容进行分析的三个步骤   链式调用的形式来处理

       

             

    文档路由原理

         

        

  • 相关阅读:
    【小技巧】如何输入未知长度的数组,用回车结束输入
    Python基础(二)
    Python基础(一)
    Appium Mac 环境安装
    c# 多线程
    c# 并行计算
    C# 反射
    VI 编辑器
    Linq and Lambda
    WINDOWS 命令
  • 原文地址:https://www.cnblogs.com/yxh168/p/11386706.html
Copyright © 2020-2023  润新知