• 在MongoDB中一起使用$or和sort()时,查询性能差的一种解决方案


    在前面文章曾经提到,在MongoDB中一起使用$or和sort()时,查询性能会很差,详见:http://www.cnblogs.com/xinghebuluo/archive/2011/12/01/2270590.html

    在mongodb的计划中,2.5.w版本中可能会修改这个bug。

    我的项目中也遇到了这个问题,后来自己想了一个解决方案,暂时规避了这个问题,现在把这个方案分享出来,和大家讨论一下.

    这个解决方案是受到了mongos的源代码的启示,众所周知mongodb是分布式架构,那么在我们使用mongos查询并使用排序的时候,mongos需要把查询请求发送给各个shard,并将每个shard的查询结果

    存放在一个队列中(队列中已经排好序)。这里假定有2个shard(多个shard的原理是一样的),查询条件为{“age”:20},排序条件为:{"time":1},mongos实现示意图如下:

    1. mongos首先向两个shard发送查询排序命令。

    2.两个shard返回结果是排序后的两个队列,如图所示。

    3.客户端在取记录时,mongos取出两个队列的第一个元素,判断time值小的记录返回给客户端。

    4.客户端再取记录时,重复步骤3,从两个队列中取time值小的记录返回给客户端。

    正是受到mongos的启发,在遇到or查询并sort的情况时,把or的查询条件分解为多次查询,然后实现了一个查询类,里面保存了list<DBObject q>,然后向mongos发起多次查询排序请求,

    此时得到多个cursor,此时的cursor就类似于上面的队列,即此时得到了多个排序好的队列,然后经过简单比较后,依次把记录返回给客户端。

    例如,此时查询{"$or":[{"age":20},{"name":"li"}]},排序条件为{"Time":1},可以分解为2次查询:{"age":20},{"name":"li"},执行查询后,得到两个cursor,即两个队列,如下:、

    此时就可以重复mongos的步骤了,在客户端取记录时,对队列(cursor)中的第一个元素做比较,取出time值最小的记录返回给客户端。

    该解决方案的优点如下:

    1.可以使用索引,速度很快。

    2.封装类后,可以供多个业务使用。

    缺点如下:

    1. 每个队列中会缓存一些记录,这无形中造成了一些流量浪费和内存浪费。

    上面是我对这个方案的整体思路,欢迎大家讨论。

    https://github.com/tomliugen
  • 相关阅读:
    hdu 5444 Elven Postman 二叉树
    tensorflow2.x模型保存问题
    【NVIDIA】Win10 + CUDA10 + cuDNN 安装教程(转载)和遇到的坑
    windows下 为不同虚拟环境配置不同的cuda
    多线程
    socket编程
    引用类型和值类型
    记录报错
    github下载慢问题
    LabelImg的安装出现No module named 'libs.resources'错误
  • 原文地址:https://www.cnblogs.com/xinghebuluo/p/3105479.html
Copyright © 2020-2023  润新知