• ES学习(九)


    一、倒排索引

      A、建立前会进行normalization,也就是说对各个单词进行相应的处理(时态、大小写、同义词等),以提升后面搜索时候搜到相关文档的概率

    二、分词器

      A、character filter:分词之前进行预处理,过滤html标签,&转换成and等等

      B、tokenizer:分词

      C、token filter: normalization的一些操作

    三、内置分词器(默认:standard)

      A、standard analyzer

      B、simple analyzer

      C、whitespace analyzer

      D、language analyzer

    三、query string会用跟建立倒排索引一样的分词器去分词 

    四、mapping

      A、如何建立索引

        1. analyzed:会被分词

        2. not_analyzed:不会被分词,当成exactly value

        3. no:不会被索引

      B、修改mapping

        只能创建index时手动建立mapping,或者新增field mapping,但是不能update mapping

    五、复杂数据类型

      A、multivalue field

        {"tags":["tag1","tag2"]}

      B、empty field

        null, [], [null]

      C、object field

        {}

        

  • 相关阅读:
    1334: 好老师
    poj 2255 Tree Recovery
    2006浙大:简单计算器
    POJ1001(C++处理大数)
    HDU2159(二维完全背包)
    POJ2080:Calendar(计算日期)
    2008上交:Day of Week
    POJ1365:质因数分解
    VIJOS:P1706(舞会)
    POJ2449:K短路
  • 原文地址:https://www.cnblogs.com/DjanFey/p/12121010.html
Copyright © 2020-2023  润新知