• 67.倒排索引结构理解


    倒排索引,是适合用于进行搜索的,倒排索引的结构是比较复杂的,总体来说包括以下几个部分

    1)包含这个关键词的document list

    2)包含这个关键词的所有document的数量:IDFinverse document frequency

    3)这个关键词在每个document中出现的次数:TFterm frequency

    4)这个关键词在这个document中的次序

    5)每个document的长度:length norm

    6)包含这个关键词的所有document的平均长度

       

    倒排索引是不可变的,不可变的好处有:

    1)不需要锁,提升并发能力,避免锁的问题

    2)数据不变,只要cache内存足够就可以一直保存在os cache中,

    3)因为数据不变,filter cache可以一直驻留在内存中,提升性能

    4)可以压缩,节省cpuio开销

       

    倒排索引不可变的坏处:每次都要重新构建整个索引

  • 相关阅读:
    [转]难过的时候看看,也许会豁然开朗
    热爱生活
    [转]MTOM 编码
    11/16
    11/10 The Day Before Single's Day
    About working overtime
    hehe
    The First Blog
    配置MapServer出现的一些问题及解决办法
    Ubuntu 系统下终端快捷键设置
  • 原文地址:https://www.cnblogs.com/liuqianli/p/8476903.html
Copyright © 2020-2023  润新知