mongodb-4.4.10版本SQL查询进阶，mongodb与mysql的select SQL大比拼

基础的mongodb增删改查入门，请查看我的另一篇博文《mongodb-4.4.10版本与MySQL的SQL语法对比，以及mongodb增删改查入门demo》。

mongo的索引管理，请查看《mongodb-4.4.10版本的索引管理：创建、删除》

这篇文章给大家讲讲mongo的高阶查询。

查询选择器：

运算符类型	运算符	描述
范围	$eq	等于
	$lt	小于
	$gt	大于
	$lte	小于等于
	$gte	大于等于
	$in	判断元素是否在指定的集合范围里
	$all	判断数组中是否包含某几个元素，无关顺序
	$min	判断元素是否不在指定的集合范围里
布尔运算	$ne	不等于，不匹配参数条件
	$not	不匹配结果
	$or	有一个条件成立则匹配
	$nor	所有条件都不匹配
	$and	所有条件都必须匹配
	$exists	判断元素是否存在
其他	.	子文档匹配
其他	$regex	正则表达式匹配

./mongo localhost:27017 连接到mongodb指令

假设我的mongo里有个lison数据库，有个users集合，集合里有这样一些BSON结构的数据：

{
    "id": 1,
    "username": "ZhangSan",
    "money":150.88,
    "age":20,
    "birthday": "2011-11-26",
    "createTime":"2020-05-15 10:00:00",
    "updateTime":"2011-11-26 12:26:21",
    "address": {
         "code":"411000"
        "adress_detail":"长沙"
    },
    "favorites": {
        "movies":["蜘蛛侠","钢铁侠","蝙蝠侠"],
        "cites":["北京","杭州","上海"]
    },
    "comments":[
      {"author":"lisi","content":"第1楼评论内容","commentTime":ISODate("2017-06-06T10:15:22.00Z")},
      {"author":"wangwu","content":"第2楼评论内容","commentTime":ISODate("2017-06-07T12:16:11.00Z")},
      {"author":"liuliu","content":"第3楼评论内容","commentTime":ISODate("2017-06-08T13:17:20.00Z")},
    ]
}

例如and, or, like, in 这样的查询选择符，请查看我的另一篇博文《mongodb-4.4.10版本查询选择器列表》

我们照例拿mysql和mongo的SQL做对比：

	Mongo	MySQL
select cl1,cl2	db.users.find({"username":"xxx"},{"username":1,"age":1}).pretty() 这里的1就表示仅查询出该字段，这些字段叫投影字段 db.users.find({"username":"Chen"},{"username":1}).pretty() db.users.find({},{"username":1}).pretty()	select username, age from uses where username = 'xxx' select username from uses where username = 'Chen' select username from uses
select cl1,cl2, _id	db.users.find({"username":"xxx"},{"username":0}).pretty() 查询字段里不要username，这些字段叫投影字段，其他字段都要。 0表示排除字段，非0表示字段选择并排除其他字段，所有字段必须设置同样的值，但是_id主键可以例外。 db.users.find({},{"username":0}).pretty() db.users.find({"username":"xxx"},{"username":1,"age":0}).pretty() 如果这么写会报错，因为投影字段要么全设置为1，要么全设置为0。但是有个例外：_id 主键字段可以很特殊的不要： db.users.find({"username":"Chen"},{"username":1,"_id":0}).pretty()	select age,money,createTime from uses where username = 'xxx' 查询字段里不要username，其他字段都要 select age,money,createTime from uses
count	db.users.find({}).count()	select count(*) from users
where	db.users.find({"username":"xxx"})	select * from users where username = 'xxx'
and	db.users.find({ “$and”: [{"username":"xxx"},{"age":18}] }).pretty()	select * from users where username = 'xxx' and age = 18
or	db.users.find({ “$or”: [{"username":"xxx"},{"age":18}] }).pretty()	select * from users where username = 'xxx' or age = 18
in	db.users.find({"username": {"$in": ["x1","x2","x3"] } }).pretty()	select * from users where username = 'x1' or username = 'x2' or username = 'x3'
exists	db.users.find({"money": {"$exists":true} }).pretty() 如果这样写，表示我要查出集合里有money字段的记录，如果是false，那么就查出没有money字段的集合记录。	select * from users where user_id exists (select user_id from orders) mysql里的exists表示是不是有相应的值的存在记录，而mongo里的exists表示有没有该字段。
< 小于	db.users.find({"age": {"$lt":20} }).pretty(); db.users.find({"age": {"$not": {"$gte":20}} }).pretty(); -- 在这里对大于20的再取反也是一样的效果 db.users.find({ “$or”: [ {"age": {"$lt":20} } ,{"age": {"$exists":true}} ] }).pretty() 这里表示age小于20或者age字段存在的记录	select * from users where age < 20; select * from users where age < 20 or age exists ( select age from mylog );
order by	db.users.find().sort({"username": 1 }).pretty() 1：升序 db.users.find().sort({"username": -1 }).pretty() -1：降序	select * from users order by username asc select * from users order by username desc
sort limit skip	db.users.find().sort({"username":1}).limit(2).skip(4) limit表示取多少条数据，skip表示跳过多少条数据，尽量避免使用skip跳过大量数据，会影响性能。 sort里的1: 升序(asc), -1: 降序(desc)	select * from users order by username asc limit 4,2
distinct	db.users.distinct("username").pretty();	select distinct username from users
子文档查询	db.users.find({"favorites.movies":"蜘蛛侠"}) 注意这里的favorites.movies必须要有双引号查询数组中包含"蜘蛛侠"	select * from users wehre favorites.movies like '%蜘蛛侠%'
子文档查询 “全是”	db.users.find({"favorites.movies":{"$all":[ "雷神", "战狼" ]}},{"favorites.movies":1}) 查询数组包含["雷神", "战狼" ]的文档，跟顺序无关，跟数量有关。也就是雷神1和战狼谁前谁后顺序无关，只要都包含就行，且无其他值。
子文档查询 "in"	db.users.find({"favorites.movies":{"$in":[ "雷神", "战狼" ]}},{"favorites.movies":1}) 查询数组包含["雷神", "战狼" ]中任意一个的文档，跟顺序无关，跟数量无关
子文档查询 “===”	db.users.find({"favorites.movies":[ "杀破狼", "战狼", "雷神" ]}).pretty(); "==="。查询数组等于[ "杀破狼", "战狼", "雷神" ]的文档，严格按照数量、顺序；也就是数组里的值顺序必须是：杀破狼、战狼、雷神，这叫按照顺序，且不能有其他值，这叫按照数量
子文档查询数组中的第一个值	db.users.find({"favorites.movies.0": "杀破狼" ]}).pretty(); 查找数组中第一个值为杀破狼的数据
子文档查询数组中取值	db.users.find({},{"favorites.movies":{"$slice":[0,3]},"favorites":1}) $slice可以从数组中取出从0条到第3条的数据； [3,3] 就是从第3条开始，获取出3条 [10,3] 就是从第10条开始，获取出3条
	db.users.find({"comment": {"author":"lisi","content":"第1楼评论内容","commentTime":ISODate("2017-06-06T10:15:22.00Z")} }) 每一个值都要一样，精确查找
	db.users.find({"comment.author": "lisi" }) 查找lisi发表的所有评论
	db.users.find({"comment.author": {"$in": ["lisi","wangwu"] } }) 查找lisi或者wangwu评论过的
	db.users.find({"comment.author": {"$all": ["lisi","wangwu"] } }) 查找lisi和wangwu都评论过的
	db.users.find({"comment": {"$elemMatch": {"author":"lisi", "content":{"$regex":".不良评论."}} } }) 查找lisi发表的，并且内容包含"不良评论"的，这里的.*就是mysql里的%
group	$group符的存在可以支持mongo其他聚合操作，比如: avg, min, max
max min avg	db.users.aggregate({ "$group": { "_id":"$_id", "max_age":{ "$min":"$age"}} }) 注意这里的$_id取的是_id主键的值 db.users.aggregate({ "$group": { "_id":"abc", "max_age":{ "$min":"$age"}} }) 注意这里的abc是给一个固定的值abc，并不是从_id字段里取值上面举例max的例子，min；avg用法类同	select _id, max(age) from users group by _id select 'abc', max(age) from users
【应用例子】查询2015年4月3号之前，每个用户每个月消费的总金额，并按用户名进行排序	db.orders.aggregate([ {"$match":{ "orderTime" : { "$lt" : new Date("2015-04-03T16:00:00.000Z")} }}, {"$group":{ "_id":{ "user_id":"$use_id", "month": {"$month":"$orderTime"} }, "total":{"$sum":"$price"} }}, {"$sort":{"_id":1}} ])	select orderMonth, useCode, sum(price) from orders where orderTime < '2015-04-03 16:00:00' group by user_id, month(orderTime) orderMonth sort by _id desc
$unwind 打散数据	比如这样的数据： { “username”:"lisi", "age":20, "favorites": {"movies":["蜘蛛侠","钢铁侠"]} } 上面这一行数据，使用$unwind将favorites.movies字段打散数据后就变成了2行数据： db.users.aggregate([{"$match":{"username":"cang" }},{ "$unwind":"$favorites.movies" }]).pretty() 两行数据： {“username”:"lisi","age":20,"favorites": {"movies":"蜘蛛侠"}} {“username”:"lisi","age":20,"favorites": {"movies":"钢铁侠"}} 数据打散后可以进行group by和sort的例子： db.orders.aggregate([ {"$match":{ "orderTime" : {"$lt" : new Date("2015-04-03T16:00:00.000Z")} }}, {"$unwind":"$Auditors"}, {"$group":{ "_id":{"Auditors":"$Auditors"}, "total":{"$sum":"$price"} }}, {"$sort":{"_id":1}} ])
打散数据，例子2	db.users.aggregate([ {"$match":{"username":"lison"}}, {"$unwind":"$comments"}, {"$sort":{"comments.commentTime":1}}, {"$project":{"comments":1}}, // 仅select这个字段，其他字段不要 {"$skip":0}, {"$limit":3} ])	左边这个mongodb的sql相当于（不全是）这个mysql的例子: select comments from users where username = 'lison' group by comments order by comments.commentTime asc limit 0,3

避免使用不使用索引的查询符：$ne, $nin, $where等

【开启慢查询记录】

开启内置查询分析器，类似于开启mysql的explain： db.setProfilingLevel(n,{m}) n的取值可选：0,1,2。例子：db.setProfilingLevel(1,2000) 表示开启慢速操作记录，记录下超过2000ms的慢速操作
0 是默认值，表示不记录任何慢查询
1 表示记录慢速操作，如果置为1，m必须赋值，单位为ms，用于定义慢速查询时间的阈值。
2 表示记录所有的读写操作

【慢查询记录集合】

慢速查询结果会保存到一个特殊的盖子集合system.profile里，这个集合分配了128kb的空间，要确保监控分析数据不会消耗太多的系统性资源，盖子集合维护了自然的插入顺序，可以使用$natural操作符进行排序，
如：db.system.profile.find().sort({"$natural":-1}).limit(5) 按照时间顺序倒序取出最新5条数据

盖子集合的大小或者数量是固定的，且不能做update和delete，容量满了之后，按照时间顺序，新文档会覆盖旧文档。

【慢查询分析explain】

db.users.find({“age”:20}).explain('executionStats') 我要查询age = 20的数据，并且查看这个查询的执行计划，explain的入参有3个可选值：

queryPlanner 默认值。表示仅仅展示执行计划信息
executionStats 表示展示执行计划信息同时展示被选中的执行计划的执行情况信息
allPlansExecution 表示展示执行计划信息，并展示被选中的执行计划的执行情况信息，还展示备选的执行计划的执行情况信息

【explain结果解析】

queryPlanner（执行计划描述）

winningPlan（被选中的执行计划）

stage（可选项:COLLSCAN 没有走索引；IXSCAN使用了索引）关于索引，查看另一篇博文《mongodb-4.4.10版本的索引管理：创建、删除》

rejectedPlans(候选的执行计划)

executionStats(执行情况描述)

nReturned （返回的文档个数）

executionTimeMillis（执行时间ms）

totalKeysExamined （查询了多少数据）

totalDocsExamined （匹配了多少文档）

inputStage : {
indexName 目前用到了哪个索引
}

优化目标 Tips:

1.根据需求建立索引
2.每个查询都要使用索引以提高查询效率, winningPlan. stage 必须为IXSCAN ；
3.追求totalDocsExamined = nReturned

如果出现了慢查询，我们就需要使用mongo的索引来优化它，关于mongo的索引管理，请查看《mongodb-4.4.10版本的索引管理：创建、删除》

end.

支付宝扫一扫，为女程序员打赏!

作者：梦幻朵颜

版权：本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。

相关阅读:
[Golang] 解决 Goland配置GOROOT The selected directory is not a valid home for Go Sdk
gin bind(重要)
如何优雅的限制 Kubernetes 节点上运行的 Pod 数量
 postman中 formdata、xwwwformurlencoded、raw、binary的区别
 idea 脚手架
 baselines算法库baselines/bench/monitor.py模块分析
 【转载】 tensorflow变量默认是如何进行初始化的？
【转载】 pytorch锁死在dataloader（训练时卡死）
baselines算法库common/retro_wrappers.py模块分析
 使用TensorFlow、Pytorch等深度学习框架时如何设置对OpenCV的使用
原文地址：https://www.cnblogs.com/zhuwenjoyce/p/15484382.html