数据库规范化与范式
冗余导致多种更新异常,也就是插入、更新和删除行的操作困难。
规范化(normalization)是通过修改表以减少冗余和矛盾的一系列步骤。
在每一步之后,数据库都达到一个特定的范式(normal form) 。
关系模型定义了三种范式,以著名的序数命名。
第一范式(1NF)
第二范式(2NF)
第三范式(3NF)
每一种范式都比前一种更健壮。符合3NF的数据库也符合2NF和1NF。规范化水平越高,表的数量也越多。
无损分解(lossless decomposition)能确保表的分割不会引起信息丢失。
依赖-保持分解(dependency-preserving decomposition)能确保联系不丢失。
当表被分割的时候,存在匹配的主键和外键列不应被认为是多余的数据。
规范化不是系统化,它是一个涉及重复表的分割、重新联结和精炼的迭代过程。
第一范式(1NF)
满足第一范式的表:
列仅包含原子值。
没有重复的组。
原子值(也称为标量值)是不能再细分的单一值。
重复的组是两个或多个逻辑相关联的列的集合。
第二范式(2NF)
当满足下列条件时,第一范式的表自动满足第二范式:
主键是一个列(也就是说,关键字不是组合的)。
表中所有的列是主键的一部分(单一的或组合的)。
满足第二范式的表:
满足第一范式。
非部分函数依赖。
如果表中的一些组合键(但不是全部)值确定了一个非键列的值,则表包含部分函数依赖。
第二范式表是完全函数依赖,意味着如果组合键中任何一列值改变,将导致非键列的值需要被更新。
第三范式(3NF)
满足第三范式的表:
满足第二范式。
没有传递依赖。
如果一个非键列的值确定了另一个另一个非键列的值,则表包含传递依赖。
在第三范式的表中,非键列相互独立并且只依赖于主键列。