• 数据库三大范式


    原文:http://www.cnblogs.com/linjiqin/archive/2012/04/01/2428695.html

    为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

     

    ◆ 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 
    考虑这样一个表:【联系人】(姓名,性别,电话) 
    如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1NF。要符合 1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1NF 很好辨别,但是 2NF 和 3NF 就容易搞混淆。 

     

     

    ◆ 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。

    一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中;

    不符合第二范式的例子: 

    表:学号, 姓名, 年龄, 课程名称, 成绩, 学分; 

    这个表明显说明了两个事务:学生信息, 课程信息; 

    存在问题: 

    数据冗余,每条记录都含有相同信息; 
    删除异常:删除所有学生成绩,就把课程信息全删除了; 
    插入异常:学生未选课,无法记录进数据库; 
    更新异常:调整课程学分,所有行都调整。 

     

     

    3.第三范式(确保每列都和主键列直接相关,而不是间接相关) (也就是说不能有传到性)

    第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

    比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段

     

     

    ◆ 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。 
    考虑一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。 
    其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。

     

     

     

     

     

     

     

    在实际开发中最为常见的设计范式有三个:

    1.第一范式(确保每列保持原子性)

    第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。

    第一范式的合理遵循需要根据系统的实际需求来定。比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。

    上表所示的用户信息遵循了第一范式的要求,这样在对用户使用城市进行分类的时候就非常方便,也提高了数据库的性能。

     

    上面这张表设计有问题:

    人物的居住地址是有多个的,应该属于一对多的关系,(参考:淘宝收货地址的管理)

     

                    

    2.第二范式(确保表中的每列都和主键相关)

    第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。

    比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。

     订单信息表

    这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。

    而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,把订单项目表也分离到另一个表中,就非常完美了。如下所示。

    这样设计,在很大程度上减小了数据库的冗余。如果要获取订单的商品信息,使用商品编号到商品信息表中查询即可。

     

    一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分                 

     

     

    3.第三范式(确保每列都和主键列直接相关,而不是间接相关)

    第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

    比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。

    这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。

     

    1NF:字段不可分; 
    2NF:有主键,非主键字段依赖主键; 
    3NF:非主键字段不能相互依赖; 

    解释: 
    1NF:原子性 字段不可再分,否则就不是关系数据库; 
    2NF:唯一性 一个表只说明一个事物; 
    3NF:每列都与主键有直接关系,不存在传递依赖; 

    不符合第一范式的例子(关系数据库中create不出这样的表): 

    表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ...... 

    存在的问题: 因为设计不出这样的表, 所以没有问题; 

    不符合第二范式的例子: 

    表:学号, 姓名, 年龄, 课程名称, 成绩, 学分; 

    这个表明显说明了两个事务:学生信息, 课程信息; 

    存在问题: 

    数据冗余,每条记录都含有相同信息; 
    删除异常:删除所有学生成绩,就把课程信息全删除了; 
    插入异常:学生未选课,无法记录进数据库; 
    更新异常:调整课程学分,所有行都调整。 

    修正: 

    学生:Student(学号, 姓名, 年龄); 

    课程:Course(课程名称, 学分); 

    选课关系:SelectCourse(学号, 课程名称, 成绩)。 

    满足第2范式只消除了插入异常。 


    不符合第三范式的例子: 

    学号, 姓名, 年龄, 所在学院, 学院联系电话,关键字为单一关键字"学号"; 

    存在依赖传递: (学号) → (所在学院) → (学院地点, 学院电话) 

    存在问题: 

    数据冗余:有重复值; 

    更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况 

    删除异常 

    修正: 
    学生:(学号, 姓名, 年龄, 所在学院); 
    学院:(学院, 地点, 电话)。 
    作者:sunxing007

  • 相关阅读:
    2019/5/13 洛谷P4742 【tarjan缩点 + 拓扑dp】
    图论500题
    欧拉回路与欧拉路径
    二分图的判定
    二分图的最大匹配以及带权匹配【匈牙利算法+KM算法】
    网络流三大算法【邻接矩阵+邻接表】POJ1273
    马拉车算法,mannacher查找最长回文子串
    tarjan算法(强连通分量 + 强连通分量缩点 + 桥(割边) + 割点 + LCA)
    luogu P5774 [JSOI2016]病毒感染 线性 dp
    luguo P2519 [HAOI2011]problem a dp+贪心
  • 原文地址:https://www.cnblogs.com/mc67/p/4990728.html
Copyright © 2020-2023  润新知