3.切分
水平切分
水平切分又称为sharding,它是将同一个表的记录拆分到多个结构相同的表中。当一个表的数据不断的增加的时候,sharding是必然的选择,它可以将数据分布到集群的不同节点上,从而缓存单个数据库的压力。
垂直切分
垂直切分是将一张表按列切分成多个表,通常是按照列的关系密集程度进行切分,也可以利用垂直切分将经常被使用的列和不经常被使用的列切分到不同的表。
在数据库的层面使用垂直切分将按数据库中表的密集程度部署到不同的库中,例如将原来的电商数据库垂直切分为商品数据库和,用户数据库等。
sharding策略
- 哈希取模:hash(key)%N
- 范围:可以是ID范围也可以是时间范围
- 映射表:使用单独的一个数据库来存储映射关系
sharding存在的问题
1.事务问题
使用分布式事务来解决,比如XA接口。
2.连接
可以将原来的连接分解成多个单表查询,然后在用户程序中进行连接
3.ID唯一性
- 使用全局唯一ID
- 为每个分片指定一个ID范围
- 分布式ID生成器