数据库基础
一、什么数据库(DataBase,简称DB)
数据库即存放数据的仓库,按一定格式从存放。
二、为什么要用数据库
解决文件和程序存放在一台机器上的不合理,和更加方便的操作文件。
2.1数据库的优势
- 程序稳定性:这样任意一台服务所在的机器崩溃了都不会影响数据和另外的服务。
- 数据一致性:所有的数据都存储在一起,搜友的程序操作的数据都是统一的,就不会出现数据一一至的现象。
- 并发:数据库可以良好的支持并发,搜友的程序操作数据库都是通过网络,而数据库本身支持并发的网络操作,不惜要我们自己写socket
- 效率:使用数据库队数据进行增删改查的小路要高出我自己处理文件很多。
2.2什么是数据库管理系统(DataBase Management System 简称DBMS)
在了解了数据(Data)和数据库(DB)的概念后,如何科学的组织和存储数据,如何高效获取和维护数据成了关键。
这就用到了一个系统软件——数据库管理系统,如MySQL,Oracle,SQLite,Access,MSSQL Server。
- MySQL主要用于大型门户,例如搜狗,新浪等,它主要的优势就是开放源代码,因为开放源代码这个数据库是免费的,他现在是甲骨文公司的产品。
- Oracle主要用于银行、铁路、飞机场等。该数据库功能强大,软件费用高。也是甲骨文公司的产品。
- sql server是微软公司的产品,狐妖应用于大中型企业,如联想、方正等。
而对数据库管理的人员一般称之为:数据库管理员DBA(Database Administrator)
2.3数据库服务器、数据管理系统、数据库、表与记录的关系(重点)
记录:1 老王 15201413111 22(多个字段的信息组成一条记录,即文件中的一行内容)
表:userinfo,studentinfo,courseinfo(即文件)
数据库:db(即文件夹)
数据库管理系统:如MySQL(是一个软件)
数据库服务器:一台计算机(对内存要求比较高)
总结:
- 数据库服务器:运行数据库管理软件
- 数据库管理软件:管理数据库
- 数据库:即文件夹,用来组织文件/表
- 表:即文件,用来存放多行内容/多条记录
四、数据库管理技术的发展历程(了解)
4.1人工管理阶段
20世纪50年代中期以前,计算机主要用于科学计算。
当时的硬件水平:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备当时的软件状况:没有操作系统,没有管理数据的软件,数据的处理方式是批处理。
人工管路数据具有以下特点:
- 数据不保存:计算机主要用于科学计算,数据临时用,临时输入,不保存
- 应用程序管理数据:数据要有应用程序直接管理,应用程序需要处理数据的逻辑+物理结构,开发负担很重
- 数据不共享:一组数据只对应一个程序,多个程序之间涉及相同数据时,必须个自定义,造成数据的大量冗余。
- 数据不具有独立性:数据的逻辑结构或物理结构发生变化后,必须对应用程序作出相应的修改,开发负担进一步加大。
4.2文件系统阶段
20世纪50年代后期到60年代中期
硬件水平:有了磁盘、磁鼓等可直接存取的存储设备
软件水平:有了操作系统,并且操作系统中已经有了专门的数据管理软件,即文件系统;处理方式上不仅有了批处理,而且能够联机实时处理
文件系统管理数据具有以下优点:
- 数据可以长期保存:计算机大量用于数据处理,因而数据需要长期保存,进行增删改查操作
- 由文件系统管理数据:文件系统这个软件,把数据组织成相对独立的数据文件,利用按文件名,按记录进行存取。实现了记录内的结构性,但整体无结构。并且程序与数据之间由文件系统提供存取方法进行转换,是应用程序与数据之间有了一定的独立性,程序员可以不必过多考虑物理细节。
文件系统管理数据具有以下缺点:
- 数据共享性差,冗余度大:一个文件对应一个应用程序,不同应用有相同数据时,也必须建立各自的文件,不能共享相同的数据,造成数据冗余,浪费空间,且相同的数据重复存储,各自管理,容易造成数据不一致性
- 数据独立性差:一旦数据的逻辑结构改变,必须修改应用程序,修改文件结构的定义。应用程序的改变,也将引起文件的数据结构的改变。因此数据与程序之间缺乏独立性。可见,文件系统仍然是一个不具有弹性的无结构的数据集合,即文件之间是孤立的,不能反映现实世界事物之间的内存联系。
4.3数据系统阶段
20世纪60年代后期以来,计算机用于管理的规模越来越大,应用越来越广泛,数据量急剧增长,同时多种应用,多种语言互相覆盖地共享数据结合要求越来越强烈
硬件水平:有了大容量磁盘,硬件架构下降
软件水平:软件价格上升(开发效率必须提升,必须将程序员从数据管理中解放出来),分布式的概念盛行。
数据库系统的特点:
- 数据结构化(如上图odboy_stu)
- 数据共享,冗余度低,易扩充
- 数据独立性高
- 数据由DBMS统一管理和控制
- 数据的安全性保护
- 数据的完整性检查
- 并发控制
- 数据库恢复
五、数据库分类
管理数据的工具有很多种,不止MySQL一个。关于分类其实可以从各个纬度来进行划分,但是我们最常使用的分类还是根据他们存取数据的特点来划分的,主要分为关系型和非关系型。
5.1关系和非关系
关系型数据库需要有表结构,表与表之间有联系。
非关系型数据库是key-value存储的,没有表结构。
关系型:如sqllite,db2,oracle,access,sql server,MySQL
非关系型:mongodb(介于关系与非关系),redis,memcache
注意:sql语句通用。
5.2内存和硬盘
硬盘:数据可以永久存储 - mysql、mongodb
内存:数据的存取效率极高 - redis、memcache
5.3sql与nosql
sql:数据库操作通过sql语句
nosql:数据库操作就是key-value形式(value就是一条记录)
sql:
stu - {'name': 'Bob', 'age': 18}
nosql:
stus - [{'name': 'Bob', 'age': 18}, {'name': 'Tom', 'age': 18}]