初始数据库
假设现在你已经是某大型互联网公司的高级程序员,让你写一个火车票购票系统,来hold住十一期间全国的购票需求,你怎么写?
由于在同一时段抢票的人数太多,所以你的程序不可能写在一台机器上,应该是多台机器一起分担用户的购票请求。
那么问题就来了,票务信息的数据存在哪里?存在文件里么?
如果存储在文件里,那么存储在哪一台机器上呢?是每台机器上都存储一份么?
首先,如果其中一台机器上卖出的票另外两台机器是感知不到的,
其次,是如果我们将数据和程序放在同一个机器上,如果程序和数据有一个出了问题都会导致整个服务不可用.。
最后,是操作文件,修改文件对python代码来说是一件很麻烦的事
基于上面这些问题,单纯的将数据存储在和程序同一台机器上的文件中是非常不明智的。
二、为什么用数据库
- 将文件和程序存在一台机器上是很不合理的。
- 操作文件是一件很麻烦的事
2.1 所以就出现了一个新的概念——数据
如此就帮助我们解决了上面出现的问题,如果将所有的数据都存储在一个独立的机器上,而对用户提供服务的机器只是存放你写的代码。
2.2 数据库的优势
三、认识数据库****3.1 什么是数据(Data)
描述事物的符号记录称为数据,描述事物的符号既可以是数字,也可以是文字、图片,图像、声音、语言等,数据由多种表现形式,它们都可以经过数字化后存入计算机
在计算机中描述一个事物,就需要抽取这一事物的典型特征,组成一条记录,就相当于文件里的一行内容,如:tank,不详,83,1935,广东,oldboy
单纯的一条记录并没有任何意义,如果我们按逗号作为分隔,依次定义各个字段的意思,相当于定义表的标题:
id,name,sex,age,birth,born_addr,company # 字段/列名
1,tank,不详,83,1935,山东,oldboy # 数据
这样我们就可以了解tank,性别不详,年龄83岁,出生于1935年,住的养老院是老男孩
3.2 什么是数据库(DataBase,简称DB)
过去人们将数据存放在文件柜里,现在数据量庞大,已经不再适用。
数据库是长期存放在计算机内、有组织、可共享的数据集合。
数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
3.3 什么是数据库管理系统(DataBase Management System 简称DBMS)
这就用到了一个系统软件---数据库管理系统,如MySQL、Oracle、SQLite、Access、MS SQL Server。
- mysql主要用于大型门户,例如搜狗、新浪等,它主要的优势就是开放源代码,因为开放源代码这个数据库是免费的,他现在是甲骨文公司的产品。
- oracle主要用于银行、铁路、飞机场等。该数据库功能强大,软件费用高。也是甲骨文公司的产品。
- sql server是微软公司的产品,主要应用于大中型企业,如联想、方正等。
而对数据库管理的人员一般称之为:数据库管理员 DBA(Database Administrator)
3.4 数据库服务器、数据管理系统、数据库、表与记录的关系(重点)
表:userinfo,studentinfo,courseinfo(即文件)
数据库:db(即文件夹)
数据库管理系统:如mysql(是一个软件)
数据库服务器:一台计算机(对内存要求比较高)
总结:
- 数据库服务器:运行数据库管理软件
- 数据库管理软件:管理数据库
- 数据库:即文件夹,用来组织文件/表
- 表:即文件,用来存放多行内容/多条记录
四、数据库管理技术的发展历程(了解)
当时的硬件水平:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备
当时的软件状况:没有操作系统,没有管理数据的软件,数据的处理方式是批处理。
人工管理数据具有以下特点:
- 数据不保存:计算机主要用于科学计算,数据临时用,临时输入,不保存
- 应用程序管理数据:数据要有应用程序自己管理,应用程序需要处理数据的逻辑+物理结构,开发负担很重
- 数据不共享:一组数据只对应一个程序,多个程序之间涉及相同数据时,必须各自定义,造成数据大量冗余
- 数据不具有独立性:数据的逻辑结构或物理结构发生变化后,必须对应用程序做出相应的修改,开发负担进一步加大
4.2 文件系统阶段
硬件水平:有了磁盘、磁鼓等可直接存取的存储设备
软件水平:有了操作系统,并且操作系统中已经有了专门的数据管理软件,即文件系统;处理方式上不仅有了批处理,而且能够联机实时处理
文件系统管理数据具有以下优点:
- 数据可以长期保存:计算机大量用于数据处理,因而数据需要长期保存,进行增删改查操作
- 由文件系统管理数据:文件系统这个软件,把数据组织成相对独立的数据文件,利用按文件名,按记录进行存取。实现了记录内的结构性,但整体无结构。并且程序与数据之间由文件系统提供存取方法进行转换,是应用程序与数据之间有了一定的独立性,程序员可以不必过多考虑物理细节。
文件系统管理数据具有以下缺点:
- 数据共享性差,冗余度大:一个文件对应一个应用程序,不同应用有相同数据时,也必须建立各自的文件,不能共享相同的数据,造成数据冗余,浪费空间,且相同的数据重复存储,各自管理,容易造成数据不一致性
- 数据独立性差:一旦数据的逻辑结构改变,必须修改应用程序,修改文件结构的定义。应用程序的改变,也将引起文件的数据结构的改变。因此数据与程序之间缺乏独立性。可见,文件系统仍然是一个不具有弹性的无结构的数据集合,即文件之间是孤立的,不能反映现实世界事物之间的内存联系。
4.3 数据系统阶段
硬件水平:有了大容量磁盘,硬件架构下降
软件水平:软件价格上升(开发效率必须提升,必须将程序员从数据管理中解放出来),分布式的概念盛行。
数据库系统的特点:
- 数据结构化(如上图odboy_stu)
- 数据共享,冗余度低,易扩充
- 数据独立性高
- 数据由DBMS统一管理和控制
- 数据的安全性保护
- 数据的完整性检查
- 并发控制
- 数据库恢复