1、倒排索引
1、倒排索引和正向索引
在全文搜索里,文档数据离不开搜索,而搜索离不开索引(没有索引搜索会很低效),倒排索引(Inverted index)是全文搜索系统里最高效的索引方法和数据结构,ES的索引就是倒排索引。
也称反向索引/置入索引或反向档案,用以存储一个映射:在全文搜索下某个单词在一个文档或者一组文档中的位置。
2、倒排索引建立索引的具体方式
需求:
在这5份文档中根据关键字“乔布斯”搜索匹配的文档,附属要求:文档的排序,这个搜索关键字在每个匹配文档中出现的位置和次数。
1)、把文档进行分词(怎么分要看实际需求)
2)、得到单词集合和文档集合(使用ID标记)
3)、根据上面俩集合得到这个矩阵/数据结构
4)、根据上表建立索引
需求实现