Mongodb支持的数据类型
数据类型 | 描述 |
---|---|
String | 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。 |
Integer | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 |
Boolean | 布尔值。用于存储布尔值(真/假)。 |
Double | 双精度浮点值。用于存储浮点值。 |
Min/Max keys | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。 |
Arrays | 用于将数组或列表或多个值存储为一个键。 |
Timestamp | 时间戳。记录文档修改或添加的具体时间。 |
Object | 用于内嵌文档。 |
Null | 用于创建空值。 |
Symbol | 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。 |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。 |
Object ID | 对象 ID。用于创建文档的 ID。 |
Binary Data | 二进制数据。用于存储二进制数据。 |
Code | 代码类型。用于在文档中存储 JavaScript 代码。 |
Regular expression | 正则表达式类型。用于存储正则表达式。 |
Mongodb可以储存的数据可以大于内存大小,Mongodb自身保证热点数据在内存中,当发现要操作的数据不在内存中的时候,Mongodb会去硬盘中加载。
Mongodb支持全文搜索和地理空间查询。
Mongodb全文检索
-
//插入测试数据 有列name和description
-
> db.stores.insert(
-
... [
-
... { _id: 1, name: "Java Hut", description: "Coffee and cakes" },
-
... { _id: 2, name: "Burger Buns", description: "Gourmet hamburgers" },
-
... { _id: 3, name: "Coffee Shop", description: "Just coffee" },
-
... { _id: 4, name: "Clothes Clothes Clothes", description: "Discount clothing" },
-
... { _id: 5, name: "Java Shopping", description: "Indonesian goods" }
-
... ]
-
... )
-
BulkWriteResult({
-
"writeErrors" : [ ],
-
"writeConcernErrors" : [ ],
-
"nInserted" : 5,
-
"nUpserted" : 0,
-
"nMatched" : 0,
-
"nModified" : 0,
-
"nRemoved" : 0,
-
"upserted" : [ ]
-
})
-
//在stores上建立所以 包含name列和description都是文本
-
> db.stores.createIndex( { name: "text", description: "text" } )
-
{
-
"createdCollectionAutomatically" : false,
-
"numIndexesBefore" : 1,
-
"numIndexesAfter" : 2,
-
"ok" : 1
-
}
-
//执行全文检索 会将关键字分词 然后匹配结果还可以 由于数据量小 速度就测不出来了
-
> db.stores.find( { $text: { $search: "java coffee shop" } } )
-
{ "_id" : 3, "name" : "Coffee Shop", "description" : "Just coffee" }
-
{ "_id" : 1, "name" : "Java Hut", "description" : "Coffee and cakes" }
-
{ "_id" : 5, "name" : "Java Shopping", "description" : "Indonesian goods" }
优势:实时的全文检索。
不知道性能如何,不支持高亮这种展示,只有在3.2+的版本才支持中文分词。
大致了解下,暂时不会用到,以后用到可以详细看手册:
https://docs.mongodb.com/manual/text-search/
当前最新的版的Mongdb3.4开始支持创建视图(view)。
Capped collections是大小固定的collection,它们支持基于插入顺序插入和检索文档的高吞吐量操作。 覆盖的集合以类似于循环缓冲区的方式工作:一旦集合填充其分配的空间,它将通过覆盖集合中最旧的文档来为新文档腾出空间。
db.createCollection(name, options)方法:
因为MongoDB在集合首次在命令中引用时隐式创建集合,所以此方法主要用于创建使用特定选项的新集合。 例如,您使用db.createCollection()创建一个Capped collections,或者创建一个使用文档验证的新集合。 db.createCollection()也用于为普通集合预分配空间。
-
db.createCollection(<name>, { capped: <boolean>,
-
autoIndexId: <boolean>,
-
size: <number>,
-
max: <number>,
-
storageEngine: <document>,
-
validator: <document>,
-
validationLevel: <string>,
-
validationAction: <string>,
-
indexOptionDefaults: <document>,
-
viewOn: <string>,
-
pipeline: <pipeline>,
-
collation: <document> } )
capped:是否Capped collections。
size:可选的。为Capped collections指定最大大小(以字节为单位)。一旦限制集合达到其最大大小,MongoDB将删除较旧的文档,为新文档腾出空间。 size字段是封顶集合所必需的,而对于其他集合则被忽略。
max:可选的。Capped collections中允许的最大文档数。Size限制优先于此限制。如果上限集合达到最大数量的文档之前达到Size限制,MongoDB将删除旧文档。如果您希望使用最大限制,请确保限制集合所需的大小限制足以包含最大数量的文档。
validator: 可选的。允许用户为集合指定验证规则或表达式。版本3.2中的新功能。
TTL集合
通过创建TTL索引,就构建了一个TTL集合,索引建立的原则:
- 索引字段必须为时间类型
建立语句:
db.ttl_test.ensureIndex({“time”:1},{expireAfterSeconds:20}})
设置其为20s后删除数据,真实情况下可能并不能精确到20s.
单个文档大小的限制:
在Mongodb2.0和之后的版本中,单个文档大小的限制为16MB。Mongodb这么设计主要是出于性能的考虑,因为查询单个文档返回给客户端之前要把整个文档拷贝到缓存中,这个拷贝工作非常昂贵。
Mongodb文档的嵌套深度最大值限制是100。
MongoDB将会把不存在的字段当做一个空的BSON对象。这样的话,对文档 { } 和 { a: null } 在 a字段上进行排序,在排序顺序上将会看做相等。
字段名_id保留用作主键; 其值在集合中必须是唯一的,是不可变的,并且可以是除数组之外的任何类型。
存储引擎是负责管理数据的MongoDB的主要组件。 MongoDB提供各种存储引擎,允许您选择最适合您的应用程序。
journal日志可帮助数据库在严重关闭的情况下恢复。 有几个可配置的选项可以使日志在性能和可靠性之间取得平衡,这对您的特定用例有效。
GridFS 是一个通用的存储系统用来处理大文件,例如那些超过16MB文档大小限制的文件。
Mongodb的持久化:
Mongodb在内存中的文件有两种:
数据文件和journal日志。
数据文件没60同步到硬盘一次。
journal日志用于记录Write ahead log,用于出错恢复。所以journal日志一般只需要存储60秒的内容就够了。
journal日志每100ms同步到硬盘一次。可以设置为更低,不过性能就下降了。
设置命令:db.adminCommand({"setParameter" : 1, "journalCommitInterval" : 10})
存储引擎:
存储引擎是数据库的组件,负责管理数据在内存和磁盘上的存储方式。
存储引擎(Storage Engine)是MongoDB的核心组件,负责管理数据如何存储在硬盘(Disk)和内存(Memory)上。从MongoDB 3.2 版本开始,MongoDB 支持多数据存储引擎(Storage Engine),MongoDB支持的存储引擎有:WiredTiger,MMAPv1和In-Memory。
MongoDB支持多个存储引擎,因为不同的引擎对于特定的工作负载更好。为您的用例选择适当的存储引擎可能会显着影响应用程序的性能。
WiredTiger是从MongoDB 3.2开始的默认存储引擎。它非常适合大多数工作负载,建议用于新的部署。 WiredTiger提供文档级并发模型,检查点和压缩等功能。在MongoDB Enterprise中,WiredTiger还支持在Rest中进行加密。
MMAPv1是原始的MongoDB存储引擎,是3.2之前的MongoDB版本的默认存储引擎。它在具有大量读取和写入的工作负载以及就地更新方面表现良好。MMAPv1有一个缺陷,随着数据的增长,它会消耗大量的磁盘空间。原因是它使用内存映射文件的方式来管理内存:内存映射文件,是由一个文件到一块内存的映射。Win32提供了允许应用程序把文件映射到一个进程的函数 (CreateFileMapping)。内存映射文件与虚拟内存有些类似,通过内存映射文件可以保留一个地址空间的区域,同时将物理存储器提交给此区域,内存文件映射的物理存储器来自一个已经存在于磁盘上的文件,而且在对该文件进行操作之前必须首先对文件进行映射。使用内存映射文件处理存储于磁盘上的文件时,将不必再对文件执行I/O操作,使得内存映射文件在处理大数据量的文件时能起到相当重要的作用。
在3.0版本之后,MMAPv1可以支持集合级别的锁。但是不支持文档级别的锁。
内存存储引擎在MongoDB Enterprise中可用。它不是将文档存储在磁盘上,而是将它们保留在内存中,以实现更可预测的数据延迟。
WiredTiger存储引擎:
从MongoDB 3.0开始,WiredTiger存储引擎在64位版本中可用。
在3.2版本更改:WiredTiger存储引擎是从MongoDB 3.2开始的默认存储引擎。 这是我们为什么使用3.2版本的原因。WiredTiger已经很成熟了。
Spring的接口:
//一个根据名字查询结果的方法
@Override
public List<Student> getByName(String name) {
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
students = this.mongoTemplate.find(query, Student.class);
return students;
}
////一个根据名字更新数据方法
@Override
public int updateByName(String name) {
int n = 0;
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
Update update = new Update();
update.set("name", "xhj");
WriteResult result = this.mongoTemplate.updateMulti(query, update, Student.class);
n = result.getN();
return n;
}