MongoDB 索引
索引支持的解析度的查询效率。如果没有索引,MongoDB 必须扫描每一个文档的集合,要选择那些文档相匹配的查询语句。这种扫描的效率非常低,会要求 mongod 做大数据量的处理。
索引是一种特殊的数据结构,存储设置在一个易于遍历形式的数据的一小部分。索引存储一个特定的字段或一组字段的值,在索引中指定的值的字段排列的。
ensureIndex() 方法
要创建一个索引,需要使用MongoDB 的ensureIndex()方法。
语法:
ensureIndex() 方法的基本语法如下
>db.COLLECTION_NAME.ensureIndex({KEY:1})
这里关键是要在其中创建索引,1是按升序排列的字段名称。要创建降序索引,需要使用-1。
例子
>db.mycol.ensureIndex({"title":1})
>
在ensureIndex()方法,可以通过多个字段多个字段上创建索引。
>db.mycol.ensureIndex({"title":1,"description":-1})
>
ensureIndex() 方法也可以接受的选项列表(可选),其下面给出的列表:
参数 | 类型 | 描述 |
---|---|---|
background | Boolean | 在后台建立索引,以便建立索引并不能阻止其他数据库活动。指定true建立在后台。默认值是 false. |
unique | Boolean | 创建唯一索引,以便收集不会接受插入索引键或键匹配现有的值存储在索引文档。指定创建唯一索引。默认值是 false. |
name | string | 索引的名称。如果未指定,MongoDB中都生成一个索引名索引字段的名称和排序顺序串联. |
dropDups | Boolean | 创建一个唯一索引的字段,可能有重复。 MongoDB的索引只有第一次出现的一个键,从集合中删除的所有文件包含该键的后续出现的。指定创建唯一索引。默认值是 false. |
sparse | Boolean | 如果为true,指数只引用文档指定的字段。这些索引使用更少的空间,但在某些情况下,特别是各种不同的表现。默认值是 false. |
expireAfterSeconds | integer | 指定一个值,以秒为TTL控制多久MongoDB的文档保留在此集合. |
v | index version | 索引版本号。默认的索引版本取决于mongodb 运行的版本在创建索引时. |
weights | document | 权重是从1到99999范围内的数,表示该字段的意义,相对于其他的索引字段分数. |
default_language | string | 对于文本索引时,决定停止词和词干分析器和标记生成规则列表的语言。默认值是 english. |
language_override | string | 对于文本索引时,指定的名称在文档中包含覆盖默认的语言,语言字段中。默认值是语言。 |
一、索引
MongoDB提供了多样性的索引支持索引信息被保存在system.indexes中且默认总是为_id
创建索引。
1、基础索引
在字段age上创建索引1(升序);-1(降序)
上例显示出来的一共有2个索引其中_id是创建表的时候自动创建的索引此索引是不能
够删除的。
当系统已有大量数据时创建索引就是个非常耗时的活我们可以在后台执行只需指定
“backgroud:true”即可。
1
|
db.stu.ensureIndex({age:1},{background:1}) |
2、文档索引
索引可以任何类型的字段甚至文档
1
2
3
|
db.stu.insert({_id:3,name: 'user2' ,age:12,addr:{city: 'beijing' ,state: "BJ" }}) db.stu.insert({_id:4,name: 'user2' ,age:12,addr:{city: 'shanghai' ,state: "SH" }}) db.stu.ensureIndex({addr:1}) |
下面这个查询将会用到我们刚刚建立的索引
1
2
|
db.stu.find({addr:{city: 'beijing' ,state: 'BJ' }}) "_id" : 3 , "name" : "user2" , "age" : 12 , "addr" : { "city" : "beijing" , "state" : "BJ" } } |
而下面的查询却不能查到结果
1
|
db.stu. find ({addr:{state: 'BJ' ,city: 'beijing' }}) |
3、组合索引
跟其它数据库产品一样MongoDB也是有组合索引的下面我们将在addr.city和addr.state
上建立组合索引。当创建组合索引时字段后面的1表示升序-1表示降序是用1还是
用-1主要是跟排序的时候或指定范围内查询的时候有关的。
1
|
db.stu.ensureIndex({ 'addr.city' :1, 'addr.state' :1}) |
下面的查询都用到了这个索引
4、唯一索引
只需在ensureIndex命令中指定”unique:true”即可创建唯一索引。
1
|
db.t4.ensureIndex({firstname: 1, lastname: 1}, {unique: true }); |
当建唯一索引时如果表中有2条一模一模的数据就建立不了唯一索引。
5、强制使用索引
hint命令可以强制使用某个索引。
1
|
db.stu.ensureIndex({name: 1 ,age: 1 }) |
则下面不能使用索引
使用hint强制使用索引
6、删除索引
1
2
3
4
|
#删除t3 表中的所有索引 db.t3.dropIndexes() #删除t4 表中的firstname 索引 db.t4.dropIndex({firstname: 1}) |
7. 查看索引
可以通过下面的名称查看索引是否已经成功建立:
> db.test.getIndexes()
二、explain执行计划
MongoDB提供了一个explain命令让我们获知系统如何处理查询请求。利用explain命令
我们可以很好地观察系统如何使用索引来加快检索同时可以针对性优化索引。
几个关键的字段说明:
cursor:返回游标类型(BasicCursor或BtreeCursor)
nscanned:被扫描的文档数量
n:返回的文档数量
millis:耗时(毫秒)
indexBounds:所使用的索引
三、优化器profile
在MySQL中慢查询日志是经常作为我们优化数据库的依据那在MongoDB中是否有类似
的功能呢?答案是肯定的那就是MongoDBDatabaseProfiler。所以MongoDB不仅有而且
还有一些比MySQL的SlowQueryLog更详细的信息。
1、开启Profiling功能
有两种方式可以控制Profiling的开关和级别第一种是直接在启动参数里直接进行设置。
启动MongoDB时加上–profile=级别即可。
也可以在客户端调用db.setProfilingLevel(级别)命令来实时配置Profiler信息保存在
system.profile中。我们可以通过db.getProfilingLevel()命令来获取当前的Profile级别。
profile的级别可以取012三个值他们表示的意义如下
0–不开启
1–记录慢命令(默认为>100ms)
2–记录所有命令
Profile记录在级别1时会记录慢命令那么这个慢的定义是什么?上面我们说到其默认为
100ms当然有默认就有设置其设置方法和级别一样有两种一种是通过添加–slowms启
动参数配置。第二种是调用db.setProfilingLevel时加上第二个参数
1
|
db.setProfilingLevel(1,10); |
2、查询Profiling记录
与MySQL的慢查询日志不同MongoDBProfile记录是直接存在系统db里的记录位置
system.profile所以我们只要查询这个Collection的记录就可以获取到我们的Profile记
录了。列出执行时间长于某一限度(5ms)的Profile记录
1
|
db.system.profile. find ( { millis : { $gt : 5 } } ) |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
{ "op" : "command" , "ns" : "test.$cmd" , "command" : { "count" : "orders" , "query" : { }, "fields" : { } }, "ntoreturn" : 1, "keyUpdates" : 0, "numYield" : 0, "lockStats" : { "timeLockedMicros" : { "r" : NumberLong(11494), "w" : NumberLong(0) }, "timeAcquiringMicros" : { "r" : NumberLong(4), "w" : NumberLong(5) } }, "responseLength" : 48, "millis" : 11, "ts" : ISODate( "2013-11-16T13:52:38.391Z" ), "client" : "127.0.0.1" , "allUsers" : [ ], "user" : "" } |
查询最新的一条可以使用如下命令
1
|
db.system.profile. find (). sort ({$natural:-1}).limit(1) |
MongoDBShell还提供了一个比较简洁的命令showprofile可列出最近5条执行时间超过
1ms的Profile记录。
Profiling功能肯定是会影响效率的但是不太严重原因是他使用的是system.profile来记
录而system.profile是一个cappedcollection这种collection在操作上有一些限制和特点
但是效率更高。