• mongodb基础整理篇————简单介绍[一]


    前言

    简单介绍一下文档数据库。

    正文

    mongodb 是一个以json为数据模型的文档数据库。

    这里要介绍一下什么是json。因为有些人认为'{a:1,b:2}' 是json,而"this is a" 不是json。

    然证明这的确是一个json。事实证明数组也是。

    所以不能把json想的过于狭义。

    可以看下百度百科:

    https://baike.baidu.com/item/JSON/2462549?fr=aladdin

    那么什么是文档数据库?

    从1989年起,Lotus通过其群件产品Notes提出了数据库技术的全新概念-"文档数据库",文档数据库区别于传统的其它数据库,它是用来管理文档。在传统的数据库中,信息被分割成离散的数据段,而在文档数据库中,文档是处理信息的基本单位。一文档可以很长、很复杂、可以无结构,与字处理文档类似。一个文档相当于关系数据库中的一条记录。

    因为mongodb 是文档数据库,且是以json为数据模型的,那么可以想想,mongdb的最小单位就是一个文档,也就是mongodb里面的一条记录或者说一个json。

    我们知道mongodb是开源的,为什么开源呢? 其实这就是一种新的市场模式,而不仅仅说互联网时代开源style,要知道天下没有免费的午餐。

    mongodb 是 mongodbBD Inc的上市公司开发的,提供mongodb服务的。有人会想mongodb 开源了,别人不就免费了吗?这不得亏本,还能搞上市。

    要知道一个公司如果使用mongodb到达一定的时候,是要有方案才能维护用户,这就是mongodb Inc的业务,业务才是赚钱的。开源并不会影响该公司的收入,同样的还多了这么多测试实例,所以不用想到别人开源免费让你使用,就好像占了多大便宜一样。

    mongodb 有两个版本,一个是社区版一个是企业版。社区版基于SSPL,一种和AGPL基本类似的开源协议,企业版是基于商业协议,需要付费的。

    使用用给产品,那么需要知道其中的历史。

    1. 0.x 2008 可以说是mongdb的诞生,可以用来存储然后读取。

    2. 1.x 2010 提供了复制集和分片集,这个时候提供高可用了。

    3. 2.x 更丰富的数据库功能,以前几乎只是单纯的读取和写入,跟丰富的数据库就加入了很多功能,如聚合等。

    4. 3.x 收购WiredTiger 和发展周边生态环境,这个时候mongodb才走向成熟了。 因为当时mongodb 有了数据引擎,也就是有了带有芯片的发动机,这个时候mongodb 很多提的bug,或者速度问题得到解决了。

    所以市场上大多数应该是3.x以上的,毕竟没有芯片的发动机还是相当危险的。

    1. 4.x 2018 分布式事务支持,所以要想使用事务,那么需要使用4 以上的版本。

    现在很多公司开始使用mongodb了,为什么要使用呢? 其优势是什么。

    说一下个人使用情况,因为微服务的使用,说一说mongodb相比其他数据库的优点。

    微服务讲究一个服务自治的概念,也就是说每一个服务其实都是有一个数据库的。

    那么这个时候就面临选择了,选择关系型数据库还是非关系型数据库了。

    这个时候应该大部分时候会使用非关系型数据库,为什么这么说呢?

    因为微服务的服务自治,该服务一般设计的业务比较简单。

    比如一个account服务,里面有用户信息,用户的团队信息,用户的等级信息。他们都是信息,但是他们之间没有什么联系,其实也就是记录,故而非关系数据库好些,这样设计模型也简单一些。

    然后还有一个就是比如说account 服务存储用户信息,那一条用户信息里面增加了一个字段,那么其实是可以之间在代码中增加该字段的写入,而不需去增加一个像关系数据库里面一样去改变表的结构。

    我们知道如果去修改表的结构的话,还是一个风险高的事件,不是说增加字段这个操作有多危险,而是增加字段的时候,其实会修改每一条记录的数据,如果遇到庞大的数据体,还是会影响到线上的,mongodb 对此还是非常灵活的。

    可以看到mongodb 非常灵活,因为mongodb 太灵活了,那么太灵活的东西也有不好的问题,那就是比如我们sex这个字段,要不是男要不是女,那么不得对其进行约束?

    事实上mongodb也提供了jsonSchema这个东西来进行约束了。https://www.docs4dev.com/docs/zh/mongodb/v3.6/reference/reference-operator-query-jsonSchema.html

    这东西不一定要用,如果我们在应用层面没问题的话,其实是不需要的。

    mongodb 使用过程还发现其一个设计特点,比如说有一个网关api的权限表设计:

    {
    userId:"xxx",
    permission:[// 相关权限]
    }

    以我们的关系模型设计呢,这个permission可能就是一张表了,而在此,只是一个属性。

    又比如说用户设置密码找回3个问题:
    {
    userid:"",
    questions:[
    {
    'question':'xxx',
    'answers':'xxx'
    },
    ....
    ]
    }

    这条记录就可以覆盖一个场景。

    这些都是简单的场景,如果复杂的场景,那么在关系数据库中你需要建立的表就更多了,那么表与表之间连接查询,效率可想而知。

    mongodb 能够通过简单的设计就能够覆盖一些复杂的业务模型了,这样在代码层面上也就简单了很多了。

    就像前面说的,几张表的联合查询,一张表一次行记录即可查出,那么代码的设计也很简单,代码越简单,那么维护性也就好。初学者可能觉得代码看起来越牛逼越好,其实大道至简。

    除了有些业务使用mongodb能得到设计上的简化外,还有一些也需要用到。

    比如说,数据行业,需要大量快速的存储,mongodb的存储是非常快的,结构也灵活。

    还有一个特点就是高可用和横向扩展能力。

    比如说mysql,如果数据达到1个亿,那么是会出现不流畅的,这个时候就需要重新设计和各种优化了。但是mongodb,如果达到一个亿,那么只需要使用mongodb的横向扩展能力,对于mongodb而言,这一切才刚刚开始,其定位是TB-PB级的。

    当然这是数据行业很容易遇到的场景,其他的可能没有这么快达到一个亿数据。mongodb的横向扩展和高可用方案还是可以的。

    下一节正式开始。

  • 相关阅读:
    FPGA之verilog流水灯小程序
    FPGA之Verilog点灯小程序
    FPGA学习入门
    机试题 (用 hash 实现部门管理系统 只记得大概的内容,简洁版) -- 上一篇的优化
    机试题 (用 hash 实现部门管理系统 只记得大概的内容,简洁版) --> 这里改成文件管理系统
    双向循环链表 (只需要一个 head 节点), 从头尾部 删除 插入 数据都比较方便
    使用 head + tail 两个头尾节点实现双向链表 (队列太多会占用内存), 数据的添加删除比较方便
    线程学习
    堆排序演示 ( 这个 堆排函数将适合所有的堆排, 只需要改一下比较函数)
    windows10 下访问 virtualbox 虚拟机的linux15.10/16.04 系统 及 用 putty 访问虚拟机的配置
  • 原文地址:https://www.cnblogs.com/aoximin/p/15780154.html
Copyright © 2020-2023  润新知