• MongoDB数据库详解


    第1章 数据库管理系统

    1.1 前言

    01.数据的定义:文字、图像、地理位置信息(坐标、经纬度)等

    02.数据库管理系统的定义:建立、存取和管理数据,保证数据安全和完整性的软件

    03.常见的数据库管理系统:

    关系型:MySQL、Oracle、SQL Server、Db2等
    非关系型:MongoDB、Redis、HBase等

    数据库管理系统使用情况排名https://db-engines.com/en/ranking

    1.2 NoSQL简介

    NoSQL=Not Only SQL,支持类似SQL的功能, 与Relational Database相辅相成

    其适用于性能较高,不使用SQL意味着没有结构化的存储要求(SQL为结构化的查询语句),没有约束之后架构更加灵活

    1.2.1 NoSQL数据库四大家族

    列存储:Hbase

    键值(Key-Value)存储:Redis

    图像存储:Neo4J

    文档存储:MongoDB

    1.2.2 NoSQL的优势

    高可扩展性、分布式计算、没有复杂的关系、低成本、架构灵活、半结构化数据

    第2章 MongoDB

    2.1 MongoDB特性

    即最像关系型数据库的NoSQL

    MongoDB与RDBMS的最大区别:

    没有固定的行列组织数据结构,即无需将不同类的数据放入多张表中建立对应关系并分别存储其数据,而是直接放入一份文档进行存储

    2.1.1 数据存储格式

    01. JSON

    MongoDB使用JSON(JavaScript ObjectNotation)文档存储记录

    JSON数据库语句可以容易被解析

    Web应用大量使用

    NAME-VALUE配对

    02. BSON

    二进制的JSON,JSON文档的二进制编码存储格式

    BSON有JSON没有的Date和BinData

    MongoDB中document以BSON形式存放

    数据格式灵活-文档里嵌入文档

    1 {
    2 _id: ObjectID("1"),
    3 username: “Silence”,
    4 regDate: “10-10-2015”,
    5 scores: {
    6 math: "80",
    7 english: "200"
    8   }
    9 }

    2.2 MongoDB优势

    MongoDB是开源产品,On GitHub,Licensed under the AGPL,起源&赞助by MongoDB公司,提供商业版licenses许可

    01.功能

    JSON文档模型、动态的数据模式、二级索引强大(特有)、查询功能、自动分片、水平扩展、自动复制、高可用、文本搜索、企业级安全、聚合框架MapReduce、大文件存储GridFS、地理位置索引

    支持多种存储引擎:

     

    02.存储引擎比较

     

    MySQL

    InnoDB

    MongoDB

    MAPI

    MongoDB

    WiredTiger

    事务

    YES

    NO

    NO

    锁粒度

    ROW-level行级锁

    Collection-level

    Document-level

    Geospatial

    YES

    YES

    YES

    MVCC

    YES

    NO

    NO

    Replication

    YES

    YES

    YES

    外键

    YES

    NO

    NO

    数据库集群

    NO

    YES

    YES

    B-TREE索引

    YES

    YES

    YES

    全文检索

    YES

    YES

    YES

    数据压缩

    YES

    NO

    YES

    存储限制

    64TB

    NO

    NO

    表分区

    YES

    YES(分片)

    YES(分片)

    03.数据库功能和性能分布图

     

    2.3 数据逻辑结构

    2.3.1 层次关系

    文档(document)、集合(collection)、数据库(database)

    2.3.2 层次关系图

     

    2.3.3 MongoDB与RDBMS数据结构逻辑对比

    MongoDB

    VS

    RDBMS

    集合Collection

    ->

    表Table

    文档Document

    ->

    行Row

    数据库Database

    数据库Database

    索引值Index

    ->

    索引值Index

    嵌入式文件Embedded Document

    ->

    合并Join

    引用Reference

    ->

    外键Foreign Key

    分片Shard

    ->

    分区Partition

    2.4 MongoDB适用场景

    1)网站数据:MongoDB 非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性
    2)缓存:由于性能很高,MongoDB 也适合作为信息基础设施的缓存层。在系统重启之后,由 MongoDB 搭建的持久化缓存层可以避免下层的数据源过载
    3)大尺寸,低价值的数据:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在此之前,很多时候程序员往往会选择传统的文件进行存储
    4)高伸缩性的场景:MongoDB 非常适合由数十或数百台服务器组成的数据库。MongoDB的路线图中已经包含对 MapReduce 引擎的内置支持
    5)用于对象及 JSON 数据的存储:MongoDB 的 BSON 数据格式非常适合文档化格式的存储及查询

    2.4.1 MongoDB使用场景

    1 我的数据量是有亿万级或者需要不断扩容 
    2 需要2000-3000以上的读写每秒
    3 新应用,需求会变,数据模型无法确定
    4 我需要整合多个外部数据源
    5 我的系统需要99.999%高可用
    6 我的系统需要大量的地理位置查询
    7 我的系统需要提供最小的latency
    8 我要管理的主要数据对象 <10

    说明:以上条件满足一个可以考虑MongoDB,满足两个选择MongoDB不会后悔

    第3章 MongoDB软件安装

    3.1 前提条件

    官方下载地址www.mongodb.com
    
    安装文档地址
    docs.mongodb.com
    mongoing.com

    软件所支持的平台(X86_64)

      在3.4版更改:MongoDB不再支持32位的x86平台

     

    注意:切记在选择mongodb版本时要确认支持/兼容哪些操作系统及版本信息,如使用3.2版本需安装在CentOS6.2级以上操作系统

    3.1.1 安装前准备

    01.准备Redhat或Centos6.2以上系统

    02.系统开发包完整

    03.关闭iptables及Selinux

    04.配置IP地址和hosts解析

    05.关闭hugepage大页内存

    06.创建所需用户mongod(非root用户)

    07.创建所需目录,并授权

    3.1.1.1  具体步骤

    1 [root@mongodb ~]# cat /etc/redhat-release
    2 CentOS release 6.9 (Final)
    3 
    4 [root@mongodb ~]# uname -r
    5 2.6.32-696.el6.x86_64
    6 
    7 [root@mongodb ~]# uname -m
    8 x86_64
    1 /etc/init.d/iptables status
    2 getenforce
    3 ip a
    4 echo "10.0.0.51 mongodb" >>/etc/hosts
    5 
    6 /etc/init.d/mysqld stop   #若存在mysql程序需提前关闭以防止程序冲突

    关闭大页内存机制以提高性能

    1 vim /etc/rc.local
    2 
    3 #以root用户身份在最后一行添加如下代码,重启生效
    4 if test -f /sys/kernel/mm/transparent_hugepage/enabled; then
    5   echo never > /sys/kernel/mm/transparent_hugepage/enabled
    6 fi
    7 if test -f /sys/kernel/mm/transparent_hugepage/defrag; then
    8    echo never > /sys/kernel/mm/transparent_hugepage/defrag
    9 fi

    系统关闭参照官方文档https://docs.mongodb.com/manual/tutorial/transparent-huge-pages/

    3.2 安装及启动

    01.创建所需用户和组

     1 groupadd -g 800 mongod 2 useradd -u 801 -g mongod mongod 3 passwd mongod 

    02.创建mongodb所需目录结构

     1 mkdir -p /application/mongodb/{bin,conf,log,data} 

    03.上传并解压软件到指定位置

    1 cd /application/
    2 
    3 rz#上传mongodb-linux-x86_64-3.2.8.tgz包
    4 
    5 tar -zxvf mongodb-linux-x86_64-3.2.8.tgz
    6 cd mongodb-linux-x86_64-3.2.8/bin/
    7 cp -a * /application/mongodb/bin

    04.设置目录结构权限

     1 chown -R mongod:mongod /application/mongodb 

    05.设置用户环境变量

    1 su - mongod

    2

    3 vim .bash_profile

    4 export PATH=/application/mongodb/bin:$PATH

    5

    6 source .bash_profile 

    06.启动mongodb(无需初始化)

     1 mongod --dbpath=/application/mongodb/data --logpath=/application/mongodb/log/mongodb.log --port=27017 --logappend --fork 

    说明:在启动mongodb要指定数据、日志路径及端口号(默认也可以)

    06.1成功标识

    about to fork child process, waiting until server is ready for connections.
    forked process: 1294
    child process started successfully, parent exiting

    3.2.1 mongodb启动参数详解

    mongod参数

    参数说明

    --dbpath

    数据存放路径

    --logpath

    日志文件路径

    --logappend

    日志输出方式->以追加模式进行记录,默认覆盖记录

    --port

    启用端口号

    --fork

    以后台守护进程的方式启动

    --auth

    是否需要验证权限登录(用户名和密码)

    --bind_ip

    限制访问的ip

    07.编辑配置文件->以读取配置文件的方式来启动数据库

    1 vim /application/mongodb/conf/mongod.conf
    2 
    3 dbpath=/application/mongodb/data
    4 logptah=/application/mongodb/log/mongodb.log
    5 port=27017
    6 logappend=1
    7 fork=1

    08.指定配置文件启动/关闭mongod

    1 mongod -f /application/mongodb/conf/mongod.conf #启动数据库

    2 mongod -f /application/mongodb/conf/mongod.conf shutdown #关闭 

    09.登录mongodb

    1 mongo
    2 
    3 ###此时已登陆mongodb系统,以下为提示信息###
    4 MongoDB shell version: 3.2.8
    5 connecting to: test
    6 > 

    说明:

    01.初次登录时默认提示版本号信息及连接数据库test,但是在MongoDB中test数据库默认并不存在

    02.对于3.2以上版本默认只有一个admin数据库,且无需提前创建,不存在的库也能够正常use

    3.2.2 启动时报错:"WARNING: soft rlimits too low. rlimits set to 1024 processes, 64000 files. Number of processes should be at least 32000 : 0.5 times number of files"的类似错误

    报错原因:rlimits设置过小,其设置几乎不能满足MongoDB运行所需的最小条件,会导致它运行缓慢甚至出现不可知的错误

    解决思路:

    01.查看当前的MongoDB进程信息

    1 ps -ef | grep mongod
    2 
    3 #结果如下
    4 mongod     1982      1  0 11:47 ?        00:00:16 mongod --dbpath=/application/mongodb/data --logpath=/application/mongodb/log/mongodb.log --port=27017 --logappend --fork
    5 root       2056   1566  0 12:21 pts/1    00:00:00 grep --color=auto mongod

    02.查看mongod进程的系统限制

    1 cat /proc/1982/limits
    2 
    3 #结果如下
    4 Limit             Soft Limit(软限制->最小值) Hard Limit(硬限制->最大值) Units
    5 Max processes      1024                     64000                   processes
    6 Max open files      65535                    65535                   files

    解决方法:

    ①方法一

    1 vim /etc/security/limits.d/90-nproc.conf

    2 * soft nproc 32000 #此为修改后结果,reboot重启生效 

    ②方法二

    1 vim /etc/security/limits.conf
    2 
    3 # End of file
    4 mongod soft nofile 64000
    5 mongod hard nofile 64000
    6 mongod soft nproc 32000 
    7 mongod hard nproc 32000

    查看系统限制

     1 ulimit -a 

    #也可利用ulimit [-ftvnmu]命令在shell命令行中直接进行设置

    #但若要系统启动时在所有窗口生效,需将上面的ulimit添加到/etc/profile

    3.2.3 YAML模式编写配置文件

     1 systemLog:
     2    destination: file
     3    path: "/application/mongodb/log/mongod.log"
     4    logAppend: true
     5 storage:
     6    journal:
     7       enabled: true
     8    dbPath: "/application/mongodb/data"
     9 processManagement:
    10    fork: true
    11 net:
    12    port: 27017

    此时关闭mongodb重新启动即可

    3.2.4 MongoDB的关闭方式

    3.2.4.1  kill进程模式(不建议使用)

    1 $ kill -2 PID #原理:-2表示向mongod进程发送SIGINT信号

    2

    3 $ kill -4 PID #原理:-4表示向mognod进程发送SIGTERM信号 

    3.2.4.2  自带模式

    1 use admin
    2 
    3 admin> db.adminCommand({shutdown:1})
    4 5 $ mongod -f mongodb.conf --shutdown
    6 killing process with pid: 1621

    注意:

    01.mongod进程收到SIGINTSIGTERM信号,会做一些处理

    02.切忌使用kill -9

    3.2.5 编辑脚本实现SYS-V形式启动mongod

     1 vim /etc/rc.d/init.d/mongod
     2 #!/bin/bash
     3 #
     4 #chkconfig: 2345 80 90
     5 #description:mongodb
     6 MONGODIR=/application/mongodb
     7 MONGOD=$MONGODIR/bin/mongod
     8 MONGOCONF=$MONGODIR/conf/mongod1.conf
     9 start() {
    10  su - mongod -c "$MONGOD -f $MONGOCONF"
    11 }
    12 
    13 stop() {
    14 su - mongod -c "$MONGOD -f $MONGOCONF --shutdown"
    15 }
    16 
    17 case "$1" in
    18   start)
    19  start
    20  ;;
    21   stop)
    22  stop
    23  ;;
    24   restart)
    25  stop
    26 sleep 2
    27  start
    28  ;;
    29   *)
    30  echo $"Usage: $0 {start|stop|restart}"
    31  exit 1
    32 esac
    33 
    34 
    35 chmod +x /etc/init.d/mongod
    mongod.conf

    3.3 基本操作及使用

    获取帮助

     1 > help 

        db.help()                    help on db methods
        db.mycoll.help()             help on collection methods
        sh.help()                    sharding helpers
        rs.help()                    replica set helpers
        help admin                   administrative help
        help connect                 connecting to a db help
        help keys                    key shortcuts
        help misc                    misc things to know
        help mr                      mapreduce
    
        show dbs                     show database names
        show collections             show collections in current database
        show users                   show users in current database
        show profile                 show most recent system.profile entries with time >= 1ms
        show logs                    show the accessible logger names
        show log [name]              prints out the last segment of log in memory, 'global' is default
        use <db_name>                set current database
        db.foo.find()                list objects in collection foo
        db.foo.find( { a : 1 } )     list objects in foo where a == 1
        it                           result of the last line evaluated; use to further iterate
        DBQuery.shellBatchSize = x   set default number of items to display on shell
        exit                         quit the mongo shell
    help帮助信息

    查看当前db版本

    1 > db.version()

    2 3.2.8 

    查看当前使用db

    1 > db

    2 test

    3

    4 > db.getName()

    5 test 

    查询所有数据库

    1 > show dbs

    2 local 0.000GB 

    切库

    1 > use test

    2 switched to db test 

    显示当前数据库状态

     1 > db.stats()
     2 {
     3     "db" : "local",
     4     "collections" : 1,
     5     "objects" : 7,
     6     "avgObjSize" : 1466,
     7     "dataSize" : 10262,
     8     "storageSize" : 36864,
     9     "numExtents" : 0,
    10     "indexes" : 1,
    11     "indexSize" : 36864,
    12     "ok" : 1
    13 }

    查看当前数据库的连接机器地址

    1 > db.getMongo()

    2 connection to 127.0.0.1 

    创建数据库

    当使用use命令时系统会自动创建一个数据库,如果use之后没有创建任何集合,系统就会删除这个数据库

     1 > use banana

    2 switched to db banana 

     删除数据库

    如果没有选择任何数据库,会删除默认的test数据库

    1 > db.dropDatabase()
    2 { "ok" : 1 }
    3 > show dbs;
    4 local  0.000GB

     

    创建集合

    方法1:

    1 > use banana;
    2 switched to db banana        #相当于use banana ,不同的是(从mysql关系型数据库角度解释),在mongodb中banana允许未创建情况下use banana,在创建数据表后,即创建了banana,否则banana不会创建
    3 > db.createCollection('a'); #创建集合a,a相当于mysql中的数据表
    4 { "ok" : 1 }                # 提示创建成功
    5 > db.createCollection('b');
    6 { "ok" : 1 }
    7 > show collections;
    8 a
    9 b

     方法2:

     1 > db.c.insert({username:"mongodb"})   #向c集合插入数据
     2 WriteResult({ "nInserted" : 1 })   ->成功写入文档
     3 
     4 > show collections
     5 a
     6 b
     7 c
     8 > db.c.find()   #显示数据集合中所有数据,当前仅一条
     9 { "_id" : ObjectId("5743c9a9bf72d9f7b524713d"), "username" : "mongodb" }
    10 > db.log.find().pretty();   # 格式化打印结果
    11 {
    12     "_id" : ObjectId("5743c9a9bf72d9f7b524713d"),
    13     "uid" : 0,
    14     "name" : "mongodb",
    15     "age" : 6,
    16     "date" : ISODate("2018-01-03T08:37:00.214Z")
    17 }
    18 
    19 > db.c.drop()   #删除c集合
    20 true
    21 > db.c.find()   #c集合置空

    批量插入数据

    1 > for(i=0;i<10000;i++){ db.log.insert({"uid":i,"name":"mongodb","age":6,"date":new Date()}); }   #批量插入10000个数据
    2 
    3 #查询集合中的记录数
    4 > db.log.find()
    说明:默认每页显示20条记录,当显示不下的的情况下,可以用it迭代命令查询下一页数据
     1 #设置每页显示数据的大小:每页显示50条记录
     2 > DBQuery.shellBatchSize=50; 
     3 #查看第1条记录
     4 > db.log.findOne() 
     5 #查询总的记录数
     6 > db.log.count()
     7 #删除集合中所有记录
     8 > db.log.remove({})
     9 #集合中数据的原始大小
    10 > db.log.dataSize()
    11 #集合中索引数据的原始大小
    12 > db.log.totalIndexSize()
    13 #集合中索引+数据压缩存储之后的大小
    14 > db.log.totalSize()
    15 #集合中数据压缩存储的大小
    16 > db.log.storageSize()

    此笔记是本人学习摘记整理而成,此为初稿(尚有诸多不完善之处),原创作品允许转载,转载时请务必以超链接形式标明文章原始出处,作者信息和本声明,否则将追究法律责任。

    作者:banana童

    出处:http://www.cnblogs.com/bananaaa/

  • 相关阅读:
    Jenkins修改用户密码及权限
    Selenium知识点小结
    解析图形验证码登录系统
    Pywinauto实现电脑客户端有道云签到领空间
    Python冒泡排序
    LoadRunner12常用函数
    GIT教程笔记
    LoadRunner 关联
    搭建自动化测试框架Python3+Selenium
    SSH免密从A服务器登录进B服务器,重启B服务器的tomcat
  • 原文地址:https://www.cnblogs.com/bananaaa/p/8204362.html
Copyright © 2020-2023  润新知