• 软件设计师03-数据库系统


    数据库模式

    三级模式两级映射

    外模式:视图(给用户用)

    概念模式:表

    内模式:数据的存储

    外模式概念模式映射:对表数据进行相应操作得到用户的视图

    概念模式内模式映射:调整概念模式物理存储的方式(如Mysql的InnoDB和Myisam存储模式,就是这层映射)

    数据库设计过程

    各个阶段及产物

    阶段 产物
    需求分析 数据流图、数据字典、需求说明书
    概念结构设计 ER模型(数据库实际是从这里开始,这里和数据库没关系可以为mysql、oracle)
    逻辑结构设计 关系模式(转换为表之间的关系)
    物理设计 融入DBMS的特性(Mysql和Oracle有细小的差别) 

    ER模型

    矩形表示实体、椭圆表示属性、菱形表示关系。

    ER图集成方法

    属性冲突:两个表,老师的性别一个用男女,一个用01逻辑值。

    命名冲突:老师在一个表里叫教师,在另一个表里叫教职工。

    结构冲突:同一个对象在不同应用中具有不同的抽象,同一个实体在不同局部E-R图中所包含的属性个数和属性排列次序不完全相同。

    E-R模型关系模式

    1:1联系:将对应关系记录在任意一边实体中。

    1:n联系:将对应关系记录在n实体中。

    m:n联系:将对应关系抽象成一个实体,记录在实体中。

    实体是一个关系模式,联系也是一个关系模式,多个实体之间的一个联系算一个关系模式。

    关系代数

    关系可以理解为表。

    S1关系(Sno,Sname,Sdept),S2关系(Sno,Age)

    并(∪):返回的为S1和S2全部。

    交(∩):S1和S2重复的部分。

    差(-):S1-S2代表S1中去掉S2的部分。

    笛卡尔积(×):S1×S2用关系S1(表)中逐条记录和S2的全部做乘积。

    投影(π):选择列的操作,πSno,Sname。

    选择(σ):选择行的操作。

    联接(▷◁):和笛卡尔积区别为用一个连接字段做等值连接,显示的连接的字段只保留一个。自然联接(S1和S2中相同的字段做联接)

    规范化理论

    函数依赖

    部分函数依赖:组合主键(A和B确定主键C,则C部分依赖A)。

    传递函数依赖:B依赖于A,C依赖于B,则C依赖于A,A可以直接确定C。

    价值与用途

    规范化理论主要用于解决数据冗余、更新异常、插入异常、删除异常。

    超键和侯选建相比,超键虽然能唯一标识元组,但是超键可以有冗余数据

    侯选建和主键的区别为,主键只有一个(学号和身份证号只能有一个作为主键)。

    外键是和其他表主键关联的属性。

    范式

    第一范式
     第二范式

    非主属性完全依赖于主键(不能存在部分依赖).

    数据冗余:学分就是冗余信息

    更新异常:跟新一部分学分另一部分没更新就是更新异常

    插入异常:没有学生时,新建学科和学分插入不了就是插入异常

    删除异常:删除学分时一并把学生删掉就是删除异常

    第三范式

    非主属性不能传递依赖于主键.

    BCF范式

    并发控制

    事务并发出现的问题

    封锁协议等级

    一级是基础,二级和三级封锁协议都是基于一级封锁协议。

    一级封锁协议:修改加X锁;可防止丢失更新

    二级封锁协议:修改加X锁基础上,读取加S锁(读完释放,不考虑事务下面是否会再读一次验证);可解决脏读。

    三级封锁协议:修改加X锁基础上,读取加S锁(事务执行完释放,在事务的第二次读取验证之前,其他X锁的修改事务都不能进行);可解决脏读、不可重复度。

    完整性约束

    实体完整性约束:规定表的每一行在表中是惟一的实体。

    域完整性:是指表中的列必须满足某种特定的数据类型约束,其中约束又包括取值范围、精度等规定。

    参照完整性约束:是指两个表的主关键字和外关键字的数据应一致,保证了表之间的数据的一致性,防止了数据丢失或无意义的数据在数据库中扩散。

    自定义完整性约束:针对某个特定关系数据库的约束条件,它反映某一具体应用必须满足的语义要求。

    触发器:这个属于用户自己写的一个脚本,当触发某个事件时执行。

    数据库安全

    数据备份

    备份分类

    备份分为冷备份和热备份

     

    故障与恢复

    数据仓库与数据挖掘

    数据仓库

    把以往的数据抽出来存储到数据。

    数据源:例如库存系统提取库存,销售系统提取销售数据

    抽取:从各个系统抽取数据

    清理:统一数据格式

    装载:装入数据仓库

    刷新:定期添加

    数据仓库:数据直接装载到数据仓库

    数据集市:数据仓库分部形成的多个数据集。

    OLAP:联机分析处理服务器

    前端工具:查询工具、报表工具、分析工具、数据挖掘工具

    挖掘分类

    反规范化

    规范化技术提高了增删改的速度、减少了数据冗余,数据颗粒小,导致查询效率下降,反规范化就是为了解决查询效率提出的一些手段。

    派生性冗余列:例如总额,用空间换时间

    增加冗余列:为了减少关联查询,把常用的字段直接冗余在需要的表里。

    重新组表:依据查询效率的原则重新组表。

    分割表:垂直分割水平分割,就是分表分库,为了让查询速度快。 

    大数据

    对海量数据进行处理的技术,数据具有数据量大、速度快、多样性、有价值的数据。

     

    大数据分析典型:广告推送

  • 相关阅读:
    Linux route
    python 实现自定义切片类
    python 自省机制
    python 实例方法、静态方法、类方法
    python 动态语言和协议编程
    python 鸭子类型
    信息论
    CRF keras代码实现
    CRF 详细推导、验证实例
    attention 汇总(持续)
  • 原文地址:https://www.cnblogs.com/aeolian/p/11268011.html
Copyright © 2020-2023  润新知