倒排索引优化

lucene中用的是ConjunctionScorer ，大致过程是每条倒排链不断的推进到小于等于当前最大节点的位置。当然实现细节还是很丰富的，作者很细心的把过程都列出来了，建议顺着读一边。这里摘抄部分：

首先把倒排链按第一个next排序：

itdadao

查看0~7的倒排链的第一个和最后一个是否相同，不同就开始找；取最后一个倒排的第一个元素8作为终点，第一个链表开始找8

itdadao

第0个链表跳过1到了10，那么8也不用找了都去找10就行了

itdadao

第1根链表找到了11，那么10也不用找了，找11，之后都这么做

itdadao ...... itdadao itdadao

之后遇到11，本次交集操作找到一个11，

itdadao

后续的计算也是同理，当然整个代码实现会比较复杂和讨巧。基本思路就是每条倒排链能根据当前文档迅速跳过不符合的docid，由于倒排链可以用skiplist查询，因此即使很长的倒排链，如果交集的数量很少，整个求解过程可以很快跳过不需要比较的节点。

摘自：http://www.itdadao.com/articles/c15a1147107p0.html

相关阅读:
[LeetCode]230. 二叉搜索树中第K小的元素(BST)（中序遍历）、530. 二叉搜索树的最小绝对差（BST）（中序遍历）
【二叉树-所有路经系列(根->叶子)】二叉树的所有路径、路径总和 II、路径总和、求根到叶子节点数字之和（DFS)
[LeetCode]1083. 销售分析 II(Mysql,having+if)
[LeetCode]196. 删除重复的电子邮箱(delete)
[LeetCode]面试题62. 圆圈中最后剩下的数字(数学)
[算法]十进制整数转八进制
[LeetCode]534. 游戏玩法分析 III（Mysql）
[LeetCode]Mysql小本本
[LeetCode]Mysql系列5
Java 冒泡排序的实现

原文地址：https://www.cnblogs.com/bonelee/p/6589849.html