一:首先说一下什么是三大范式:
1.第一范式(1NF):确保每一列的原子性(做到每列不可拆分)
2.第二范式(2NF):在第一范式的基础上,非主字段必须依赖于主字段(一个表只做一件事)
3.第三范式(3NF):在第二范式的基础上,消除传递依赖
上面都是官话 ,对于设计表来说 第一范式是什么意思呢 看表1-1
1-1
上面的用户表明显就不符合三大范式的第一范式:为什么呢?address字段列的数据中是"中国-北京";这是可以拆分的 可以拆分成如下表,为什么要拆分呢,当我统计地区分类时,这样明显是不好统计,我们可以改成表1-2的形式,这就符合了第一范式的要求.
1-2
那什么又是第二范式,第二范式建立在第一范式的基础之上(在第一范式的基础上,非主字段必须依赖于主字段,一个表只做一件事),看表1-3
1-3
我们在后面又添加了数学成绩,英语成绩,家产等一系列的字段,如果这样设计的话,一张表可以满足一个项目所需要的所有字段,都合成在一张表中(后面无限加字段),这样就很乱了,也违背了第二范式
那什么又是第三范式,第三范式建立在第一范式的基础之上(消除传递依赖),看表1-4
1-4
我们有一张订单表,里面有数量,单机,以及总价一些字段,但总价这个不应该有,总价是可以通过数量乘以单价得到,这就没有遵守第三范式(消除传递依赖)),如果没有理解清楚,我们再看表1-5与表1-6
1-5
1-6
在用户表中,正确来说我们用户表只该存一个企业id,企业名称这个字段是我们推导出来的,企业名称应该是去企业表中去查询,这就明显不符合第三范式;
一:再说什么是反三大范式:
说完三大范式,我们再说一下什么是反三范式,就拿第三范式来说,看表1-7
如果我们有数以万计的数据,每次查询完数据之后想要总价这个属性,我们就要进行数以万计次的计算,这明显会拖慢服务性能,就拿表1-5和1-6来说,我们每此查询用户的时候,回显企业信息的时候,还要去查询企业表,这样多了一次查询,也会拖慢服务器的性能.
总结来说呢:反三范式是基于第三范式所调整的,没有冗余的数据库未必是好的数据库,有时为了提高运行效率,就必须降低 范式标准,适当保留冗余数据。基于业务的需要合理设计数据库
注释:博客中的部分数据来自于江苏传智播客.