• mongodb删除重复数据


    注:mongodb当前版本是3.4.3
     
    插入六条数据:

     
    查询存在重复的数据:
     
    查询并循环删除重复数据:
     
    删除语句解析:
    db.userInfo.aggregate([
        {
            $group: { _id: {userName: '$userName',age: '$age'},count: {$sum: 1},dups: {$addToSet: '$_id'}}
        },
        {
            $match: {count: {$gt: 1}}
        }
    ]).forEach(function(doc){
        doc.dups.shift();
        db.userInfo.remove({_id: {$in: doc.dups}});
    })
    1.根据userName和age分组并统计数量,$group只会返回参与分组的字段,使用$addToSet在返回结果数组中增加_id字段
    2.使用$match匹配数量大于1的数据
    3.doc.dups.shift();表示从数组第一个值开始删除;作用是踢除重复数据其中一个_id,让后面的删除语句不会删除所有数据
    4.使用forEach循环根据_id删除数据
     
    $addToSet 操作符只有在值没有存在于数组中时才会向数组中添加一个值。如果值已经存在于数组中,$addToSet返回,不会修改数组。
     
    注意:forEach和$addToSet的驼峰写法不能全部写成小写,因为mongodb严格区分大小写mongodb严格区分大小写mongodb严格区分大小写,重要的事情说三遍!
     
    参考地址:http://forum.foxera.com/mongodb/topic/967/mongodb%E5%A6%82%E4%BD%95%E5%B0%86%E9%87%8D%E5%A4%8D%E7%9A%84%E6%95%B0%E6%8D%AE%E5%88%A0%E9%99%A4
  • 相关阅读:
    第四周学习进度总结
    SOA面向服务的架构
    MVC架构模式
    大型网站技术架构阅读笔记01
    Python爬虫出错
    修改安卓的gradle地址后出现cannot resolve symbol ......错误
    一线架构师阅读笔记03
    周进度报告(十)
    周进度报告(九)
    一线架构师阅读笔记02
  • 原文地址:https://www.cnblogs.com/nicolegxt/p/24b3653947991ebe73e5d70609ab2943.html
Copyright © 2020-2023  润新知