• MongoDB 中聚合统计计算--$SUM表达式


    我们一般通过表达式$sum来计算总和。因为MongoDB的文档有数组字段,所以可以简单的将计算总和分成两种:1,统计符合条件的所有文档的某个字段的总和;2,统计每个文档的数组字段里面的各个数据值的和。这两种情况都可以通过$sum表达式来完成。以上两种情况的聚合统计,分别对应与聚合框架中的 $group 操作步骤和 $project 操作步骤。

    1.$group

    直接看例子吧。

    Case 1

    测试集合mycol中的数据如下:

    {
       title: 'MongoDB Overview', 
       description: 'MongoDB is no sql database',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 100
    },
    {
       title: 'NoSQL Overview', 
       description: 'No sql database is very fast',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 10
    },
    {
       title: 'Neo4j Overview', 
       description: 'Neo4j is no sql database',
       by_user: 'Neo4j',
       url: 'http://www.neo4j.com',
       tags: ['neo4j', 'database', 'NoSQL'],
       likes: 750
    }

    现在我们通过以上集合计算每个作者所写的文章数,使用aggregate()计算

    db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])

    查询结果如下:

    /* 1 */
    {
        "_id" : "Neo4j",
        "num_tutorial" : 1
    },
    
    /* 2 */
    {
        "_id" : "runoob.com",
        "num_tutorial" : 2
    }

    Case 2

    统计每个作者被like的总和,计算表达式:

    db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])

    查询结果如下;

    /* 1 */
    {
        "_id" : "Neo4j",
        "num_tutorial" : 750
    },
    
    /* 2 */
    {
        "_id" : "runoob.com",
        "num_tutorial" : 110
    }

    Case 3

    上面例子有些简单,我们再丰富一下,测试集合sales的数据如下:

    { "_id" : 1, "item" : "abc", "price" : 10, "quantity" : 2, "date" : ISODate("2014-01-01T08:00:00Z") }
    { "_id" : 2, "item" : "jkl", "price" : 20, "quantity" : 1, "date" : ISODate("2014-02-03T09:00:00Z") }
    { "_id" : 3, "item" : "xyz", "price" : 5, "quantity" : 5, "date" : ISODate("2014-02-03T09:05:00Z") }
    { "_id" : 4, "item" : "abc", "price" : 10, "quantity" : 10, "date" : ISODate("2014-02-15T08:00:00Z") }
    { "_id" : 5, "item" : "xyz", "price" : 5, "quantity" : 10, "date" : ISODate("2014-02-15T09:05:00Z") }

    需要完成的目标是,基于日期分组,统计每天的销售额,聚合公式为:

    db.sales.aggregate(
       [
         {
           $group:
             {
               _id: { day: { $dayOfYear: "$date"}, year: { $year: "$date" } },
               totalAmount: { $sum: { $multiply: [ "$price", "$quantity" ] } },
               count: { $sum: 1 }
             }
         }
       ]
    )

    查询结果是:

    { "_id" : { "day" : 46, "year" : 2014 }, "totalAmount" : 150, "count" : 2 }
    { "_id" : { "day" : 34, "year" : 2014 }, "totalAmount" : 45, "count" : 2 }
    { "_id" : { "day" : 1, "year" : 2014 }, "totalAmount" : 20, "count" : 1 }

    Case 4

    上面的,可以看出$group,我们都使用了_id,使用了分组,那么如果,我们的需求不需要分组,应该怎么办呢?

    例如。我们现在要统计sales集合中一共卖出了多少件商品。

    如果直接去掉group 阶段的_id,如下:

    db.sales.aggregate(
       [
         {
           $group:
             {
              
               totalAmount: { $sum: "$quantity" }
             }
         }
       ]
    )
        

    则报错:

    {
        "message" : "a group specification must include an _id",
        "ok" : 0,
        "code" : 15955,
        "codeName" : "Location15955",
        "name" : "MongoError"
    }

    我们还是需要添加上_id,但是可以添加个常量,及时根据常量分组,可以为  _id : "0" 可以是   _id : "a",   _id : "b",   还可以使_id : "x",   _id : "y" 等等。

    例如:

     db.sales.aggregate(
       [
         {
           $group:
             {
              _id : "Total"
               totalAmount: { $sum: "$quantity" }
             }
         }
       ]
    )

    查询结果为:

    {
        "_id" : "Total",
        "totalAmount" : 28
    }

    2.$project阶段

    Case 5

    假设存在一个 students 集合,其数据结构如下:

    { "_id": 1, "quizzes": [ 10, 6, 7 ], "labs": [ 5, 8 ], "final": 80, "midterm": 75 }
    { "_id": 2, "quizzes": [ 9, 10 ], "labs": [ 8, 8 ], "final": 95, "midterm": 80 }
    { "_id": 3, "quizzes": [ 4, 5, 5 ], "labs": [ 6, 5 ], "final": 78, "midterm": 70 }

    现在的需求是统计每个学生的 平常的测验分数总和、实验分数总和、期末其中分数总和。

    db.students.aggregate([
       {
         $project: {
           quizTotal: { $sum: "$quizzes"},
           labTotal: { $sum: "$labs" },
           examTotal: { $sum: [ "$final", "$midterm" ] }
         }
       }
    ])

    其查询输出结果如下:

    { "_id" : 1, "quizTotal" : 23, "labTotal" : 13, "examTotal" : 155 }
    { "_id" : 2, "quizTotal" : 19, "labTotal" : 16, "examTotal" : 175 }
    { "_id" : 3, "quizTotal" : 14, "labTotal" : 11, "examTotal" : 148 }

    参考文献:

    https://www.runoob.com/mongodb/mongodb-aggregate.html

    https://docs.mongodb.com/manual/reference/operator/aggregation/sum/index.html

  • 相关阅读:
    MySQL 替换和截取指定位置字符串
    notepad++安装XML格式化插件
    个人信用报告,长啥样?怎么查?
    MySQL 查询decimal字段去除自动补零
    mapstruct使用详解
    电商物流行业中的RDC、FDC和TDC分别表示什么意思?发网详解
    借助Proxifier实现内网访问
    C++源码流程图分析!
    FFmpeg中AVPacket处理函数av_free_packet()和av_packet_free()的区别以及用法
    fopen 和它的读写标识 r、r+、rb+、rt+、w+.....
  • 原文地址:https://www.cnblogs.com/xuliuzai/p/11400546.html
Copyright © 2020-2023  润新知