• ELK学习总结(1-3)倒排索引


    1、倒排索引(反向索引)

         一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。

         常规索引,文档->关键词,费时,得把一个文档全部遍历一遍

         倒排索引,关键词->文档,全文搜索过程如下:

         1、构建单词集合:

                    先对文档进行分词,

                    然后筛选过滤,

                    得到单词集合,并编号id

                    

               2、构建文档集合:文档id

               3、建立单词、文档矩阵, 得出倒排索引,如:

                    乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}

                    苹果:{(文档1,<位置16>),1次},  {(文档5,<1>),1次}  

          

  • 相关阅读:
    位图
    3. 资源管理(条款:13-17)
    70. Implement strStr() 与 KMP算法
    69. Letter Combinations of a Phone Number
    68. Longest Common Prefix
    67. Container With Most Water
    66. Regular Expression Matching
    65. Reverse Integer && Palindrome Number
    波浪理论
    MACD理解
  • 原文地址:https://www.cnblogs.com/lexiaofei/p/6575977.html
Copyright © 2020-2023  润新知