数据库拆分：横向拆分和纵向拆分

数据库拆分：横向拆分和纵向拆分

1、水平分割：

按记录进分分割，不同的记录可以分开保存，每个子表的列数相同。

水平分割通常在下面的情况下使用：

A 表很大，分割后可以降低在查询时需要读的数据和索引的页数，同时也降低了索引的层数，提高查询速度。

B 表中的数据本来就有独立性，例如表中分别记录各个地区的数据或不同时期的数据，特别是有些数据常用，而另外一些数据不常用。

C需要把数据存放到多个介质上。

例如法规表law就可以分成两个表active－law和 inactive－law。activea－authors表中的内容是正生效的法规，是经常使用的，而inactive－law表则使已经作废的法规，不常被查询。水平分割会给应用增加复杂度，它通常在查询时需要多个表名，查询所有数据需要union操作。在许多数据库应用中，这种复杂性会超过它带来的优点，因为只要索引关键字不大，则在索引用于查询时，表中增加两到三倍数据量，查询时也就增加读一个索引层的磁盘次数。

2、垂直分割：

按列进行分割，即把一条记录分开多个地方保存，每个子表的行数相同。

把主码和一些列放到一个表，然后把主码和另外的列放到另一个表中。如果一个表中某些列常用，而另外一些列不常用，则可以采用垂直分割，另外垂直分割可以使得数据行变小，一个数据页就能存放更多的数据，在查询时就会减少I/O 次数。其缺点是需要管理冗余列，查询所有数据需要join操作。　

例如有表T1

id name qty

--------------

1 p1    10

2 p2    20

3 p3    30

4 p4    40

......

......

垂直分割就是按列进行分割，即把一条记录分开多个地方保存，每个子表的行数相同。

例如表T1，可以把id和name放到数据文件p1，把qty放到数据文件p2。

水平分割就是按记录进分分割，不同的记录可以分开保存，每个子表的列数相同。

像表T1，可以把id为单数的放到数据文件P1，双数的放到数据文件P2。

淘宝下单是在一个数据库事务中进行的，要提高数据库的事务并发数，最有效的办法是拆分，拆分有两种，一是对库进行拆分，另一种是在同一个库中对表进行拆分。

要做拆分首先就要考虑拆分依据的字段，淘宝是根据订单号做拆分的，而下单中有两个维度，买家和卖家，对订单做拆分之后，必须还是可以通过买家，卖家方便的查询着两个维度的数据。该怎么办呢？

这里留个疑问，我先介绍淘宝拆分的规模，淘宝将订单表拆分到16个mysql库中，而在每个库中又将订单表横向拆分为64份，相当于将一个表拆分为1024份。拆分之后事务会分散到1024套表中，这必然会很大程序上增加并发的事务处理能力（这儿我说是必然，但是淘宝在使用这种方案之前是要经过压力测试，实际测试出这种方案的TPS之后，才会逐步采用这种方案的）。

上面留了一个疑问，经过拆分之后如何保证买家卖家快速的查询其下的订单呢？最好的办法是保证买家和卖家下的订单在一张表中，如何保证呢？

淘宝的做法是将买家的id取模后放到订单号中。假定一个订单号是142424594267667；

对于16台服务器，每台服务器64张表只需要2位买家或卖家id的后两位数字就可以准确定位到具体的库和表。订单号中同时存在买家id的最后两位和卖家id的最后两位。分别在订单号的倒数第3，4位数和最后两位数。

假定买家id为123456789，那么在订单号中的最后两位就是89，通过89对16取模就可以定位到具体的库上，通过对64取模就可以定位到具体的表上。
相关阅读:
【转】C++多继承的细节
 【转】CVE-2010-4258 漏洞分析
 【转】cve-2013-2094 perf_event_open 漏洞分析
 android CVE 漏洞汇总
 ExecutorService中submit和execute的区别
 线程池之ThreadPoolExecutor使用
 postman接口自动化，环境变量的用法详解（附postman常用的方法）转
 件测试专家分享III GUI自动化测试相关
 Linux上运行Jmeter
时间复杂度和空间复杂度计算
原文地址：https://www.cnblogs.com/shz365/p/6349618.html