索引通过ensureIndex方法建立:
> db.collection.ensureIndex({'name': 1})
也可以建立复合索引:
> db.collection.ensureIndex({'age': 1, 'name': 1})
一般而言,采用ensureIndex({排序键}, {查询键})的方式建立复合索引效率更高。比如,针对下列操作:
> db.collection.find({'age': {'$gte': 20, '$lte':29}}).sort({'name': 1})
如采用age、name的方式建立索引,则搜索的文档很少(只检索age在20-29之间的记录),但是排序要花费大量时间。如采用name、age的方式建立索引,则搜索的文档很多(按照name排查),但是不需要排序,因为在name上建立了第一索引,所以天然按顺序排列。因为搜索很多情况下只需要返回几条记录,所以用limit限值数量后,第二种方式会远快于第一种。
也可以反向建立索引(age:1, name:-1),一般与排序顺序相同。
{'x': {'$exists': false}}也可以建立索引,但是效率偏低,因为x不存在和x值为null的存储方式一样,所以不得不遍历整个文档。
在创建索引时,可以指定unique值为true,即创建唯一索引:
> db.collection.ensureIndex({'key': 'value'}, {'unique': true})
值为null或者不存在视为同一种情况,所以创建唯一索引后,集合中最多只能有一个文档不存在key键或者key的值为value。如果希望唯一索引只针对key存在的情况有效,则可以建立稀疏索引:
> db.collection.ensureIndex({'key': 'value'}, {'unique': true, 'sparse': true})
这样唯一索引就只针对key存在的情况有效。注意,稀疏索引不一定是唯一索引,在上面的操作中把unique去掉,则得到一个不唯一的稀疏索引。这样在查询key的值时,key不存在的记录就不会返回。
可以采用explain方法对查询过程进行诊断。
不是所有情况下都适合使用索引。当集合、文档较大,或者查询为选择性查询时可以考虑索引。相反的,如果集合和文档较小,或者需要进行全表扫描时,就不应该使用索引。
想要查询集合中的所有索引时,可以用getIndexes方法:
> db.collection.getIndexes()
删除索引用dropIndex方法,需要先通过getIndexes获取name字段的值来指定需要删除的索引。