• mongodb聚合内存不足解决方案


    原因:mongodb每一个文档默认只有16M。聚合的结果是一个BSON文档,当超过16M大小时,就会报内存不够错误。

    exceeded memory limit for $group.but didn't allow external sort.

    可以采用打开使用磁盘来解决大小问题。例如

    db.flowlog.aggregate([{$group:{_id:"$_id"}}], {allowDiskUse: true})

    java代码片段

    AggregationOptions options = new AggregationOptions.Builder().allowDiskUse(true).build();
    
    Aggregation agg = Aggregation.newAggregation().withOptions(options);

    但是如果结果集超过了16M,那么依然会报错误。

    采用一个下面的聚合方法

    Aggregation agg = Aggregation.newAggregation(
                        Aggregation.group(field1
                                , field2
                                , field3)
                                .sum(field4).as("sampleField1")
                                .sum(field5).as("sampleField2"),
                        Aggregation.project(field4, field5),
                        new AggregationOperation() { 
                            @Override
                              public DBObject toDBObject(AggregationOperationContext context) {
                                return new BasicDBObject("$out", "test");
                            }
                        }).withOptions(options);

      mongo.aggregate(agg, sourceCollection, Test.class);

    红色部分是重点,构造这个agg可以将得到的结果导入插入到out中,并且不会有16M的限制问题。

     如果要在聚合的时候增加一个常量,可采用以下形式

    Aggregation agg = Aggregation.newAggregation(
                        Aggregation.group(
                                , OnofflineUserHistoryField.MAC
                                , StalogField.UTC_CODE)
                                .sum(OnofflineUserHistoryField.WIFI_UP_DOWN).as(OnofflineUserHistoryField.WIFI_UP_DOWN)
                                .sum(OnofflineUserHistoryField.ACTIVE_TIME).as(OnofflineUserHistoryField.ACTIVE_TIME),
                        Aggregation.project("mac","buildingId","utcCode",OnofflineUserHistoryField.ACTIVE_TIME, OnofflineUserHistoryField.WIFI_UP_DOWN).and(
                        new AggregationExpression() {
                            @Override
                            public DBObject toDbObject(AggregationOperationContext context) {
                                return new BasicDBObject(
                                        "$cond", new Object[]{
                                                new BasicDBObject(
                                                    "$eq", new Object[]{ "$tenantId", 0}
                                                ),
                                                20161114,
                                                20161114
                                         });
                            }
                        }).as("day").andExclude("_id"),
                或者

                          and(new AggregationExpression() {

                 @Override

                 public DBObject toDbObject(AggregationOperationContext context) { 

    
    

                    return new BasicDBObject("$add", new Object[] { 20141114 });

                }  
    
    

                 }).as("day").andExclude("_id"),

                new AggregationOperation() { 
                            @Override
                              public DBObject toDBObject(AggregationOperationContext context) {
                                return new BasicDBObject("$out", "dayStaInfoTmp");
                            }
                        }).withOptions(options);
    红色和棕色部分为聚合中增加常量的两种方法。目前没有找到更方便的聚合添加常量的方法。
  • 相关阅读:
    P5737 【深基7.例3】闰年展示
    P1200 [USACO1.1]你的飞碟在这儿Your Ride Is Here
    P1597 语句解析
    P5735 【深基7.例1】距离函数
    P1553 数字反转(升级版)
    P1598 垂直柱状图
    P1603 斯诺登的密码
    P5738 【深基7.例4】歌唱比赛
    Ext.GridPanel 用法总结(一)—— Grid基本用法
    使用CodeSmith快速规范开发.Net软件
  • 原文地址:https://www.cnblogs.com/guochunyi/p/6030663.html
Copyright © 2020-2023  润新知