软件设计师03-数据库系统

数据库模式

三级模式两级映射

外模式：视图（给用户用）

概念模式：表

内模式：数据的存储

外模式概念模式映射：对表数据进行相应操作得到用户的视图

概念模式内模式映射：调整概念模式物理存储的方式（如Mysql的InnoDB和Myisam存储模式，就是这层映射）

数据库设计过程

各个阶段及产物

阶段	产物
需求分析	数据流图、数据字典、需求说明书
概念结构设计	ER模型（数据库实际是从这里开始，这里和数据库没关系可以为mysql、oracle）
逻辑结构设计	关系模式（转换为表之间的关系）
物理设计	融入DBMS的特性（Mysql和Oracle有细小的差别）

ER模型

矩形表示实体、椭圆表示属性、菱形表示关系。

ER图集成方法

属性冲突：两个表，老师的性别一个用男女，一个用01逻辑值。

命名冲突：老师在一个表里叫教师，在另一个表里叫教职工。

结构冲突：同一个对象在不同应用中具有不同的抽象，同一个实体在不同局部E-R图中所包含的属性个数和属性排列次序不完全相同。

E-R模型关系模式

1:1联系：将对应关系记录在任意一边实体中。

1:n联系：将对应关系记录在n实体中。

m:n联系：将对应关系抽象成一个实体，记录在实体中。

实体是一个关系模式，联系也是一个关系模式，多个实体之间的一个联系算一个关系模式。

关系代数

关系可以理解为表。

S1关系（Sno,Sname,Sdept），S2关系（Sno,Age）

并(∪)：返回的为S1和S2全部。

交(∩)：S1和S2重复的部分。

差(－)：S1－S2代表S1中去掉S2的部分。

笛卡尔积(×)：S1×S2用关系S1（表）中逐条记录和S2的全部做乘积。

投影(π)：选择列的操作，πSno,Sname。

选择(σ)：选择行的操作。

联接(▷◁)：和笛卡尔积区别为用一个连接字段做等值连接，显示的连接的字段只保留一个。自然联接（S1和S2中相同的字段做联接）

规范化理论

函数依赖

部分函数依赖：组合主键（A和B确定主键C，则C部分依赖A）。

传递函数依赖：B依赖于A，C依赖于B，则C依赖于A，A可以直接确定C。

价值与用途

规范化理论主要用于解决数据冗余、更新异常、插入异常、删除异常。

键

超键和侯选建相比，超键虽然能唯一标识元组，但是超键可以有冗余数据。

侯选建和主键的区别为，主键只有一个（学号和身份证号只能有一个作为主键）。

外键是和其他表主键关联的属性。

范式

第一范式

第二范式

非主属性完全依赖于主键(不能存在部分依赖).

数据冗余：学分就是冗余信息

更新异常：跟新一部分学分另一部分没更新就是更新异常

插入异常：没有学生时，新建学科和学分插入不了就是插入异常

删除异常：删除学分时一并把学生删掉就是删除异常

第三范式

非主属性不能传递依赖于主键.

BCF范式

并发控制

事务并发出现的问题

封锁协议等级

一级是基础，二级和三级封锁协议都是基于一级封锁协议。

一级封锁协议：修改加X锁；可防止丢失更新

二级封锁协议：修改加X锁基础上，读取加S锁（读完释放，不考虑事务下面是否会再读一次验证）；可解决脏读。

三级封锁协议：修改加X锁基础上，读取加S锁（事务执行完释放，在事务的第二次读取验证之前，其他X锁的修改事务都不能进行）；可解决脏读、不可重复度。

完整性约束

实体完整性约束：规定表的每一行在表中是惟一的实体。

域完整性：是指表中的列必须满足某种特定的数据类型约束，其中约束又包括取值范围、精度等规定。

参照完整性约束：是指两个表的主关键字和外关键字的数据应一致，保证了表之间的数据的一致性，防止了数据丢失或无意义的数据在数据库中扩散。

自定义完整性约束：针对某个特定关系数据库的约束条件，它反映某一具体应用必须满足的语义要求。

触发器：这个属于用户自己写的一个脚本，当触发某个事件时执行。

数据库安全

数据备份

备份分类

备份分为冷备份和热备份

故障与恢复

数据仓库与数据挖掘

数据仓库

把以往的数据抽出来存储到数据。

数据源：例如库存系统提取库存，销售系统提取销售数据

抽取：从各个系统抽取数据

清理：统一数据格式

装载：装入数据仓库

刷新：定期添加

数据仓库：数据直接装载到数据仓库

数据集市：数据仓库分部形成的多个数据集。

OLAP：联机分析处理服务器

前端工具：查询工具、报表工具、分析工具、数据挖掘工具

挖掘分类

反规范化

规范化技术提高了增删改的速度、减少了数据冗余，数据颗粒小，导致查询效率下降，反规范化就是为了解决查询效率提出的一些手段。

派生性冗余列：例如总额，用空间换时间

增加冗余列：为了减少关联查询，把常用的字段直接冗余在需要的表里。

重新组表：依据查询效率的原则重新组表。

分割表：垂直分割水平分割，就是分表分库，为了让查询速度快。

大数据

对海量数据进行处理的技术，数据具有数据量大、速度快、多样性、有价值的数据。

大数据分析典型：广告推送

相关阅读:
Linux route
python 实现自定义切片类
 python 自省机制
 python 实例方法、静态方法、类方法
 python 动态语言和协议编程
 python 鸭子类型
 信息论
 CRF keras代码实现
 CRF 详细推导、验证实例
 attention 汇总（持续）
原文地址：https://www.cnblogs.com/aeolian/p/11268011.html