分布式事务是什么?
分布式事务就是保证各个微服务之间数据一致,本质上就是保证不同数据库的数据一致性。一致性状态包含
- 强一致性,任何时刻,所有节点中数据都是一样的
- 弱一致性,数据更新后,只能访问到部分节点数据或者是全部访问不到
- 最终一致性,不保证任何时刻一样,但随着时间推移最终会达到一致性状态
因此,存在如下几种方案:
2PC ,二阶段提交是一种尽量强一致性设计,引入一个事务协调者来协调和管理各参与者的提交和回滚,包含准备和提交两个阶段,阶段之间同步阻塞,准备阶段协调者有超时机制。
大致流程:
- 准备阶段 向各个参与者发送准备命令,可以理解为把除了提交事务之外的事情都做好。所有参与者都返回准备成功则下一阶段提交事务,否则下一阶段协调者就会向所有参与者发送回滚事务的请求,即分布式事务执行失败。
- 提交阶段 可能提交事务也可能回滚事务,并且存在回滚失败或者提交失败,失败之后就会不断重试。
存在问题:
- 单点故障。协调者是一个单点。解决办法,通过选举得到新的协调者,各个组件都记录log
- 同步阻塞,效率低。①阶段之间阻塞。②其中一个参与者占用了共享资源就只能阻塞等待。
- 不确定性。提交阶段协调者发送提交命令之后,只有一个参与者收到命令,但是两个都挂了,新的协调者并不知道接下来是提交或者是回滚。
- 数据不一致。极端条件下数据不一致。
场景:目前支付宝使用2PC两阶段提交思想实现了分布式事务服务,它是一个分布式事务框架,用来保障在大规模分布式环境下事务的最终一致性。
3PC,为了解决2PC的不确定性,包含准备,预提交,提交三个阶段。准备阶段只是询问参与者的状态,其他阶段分别对应2PC。相比2PC,参与者也有超时机制(防止在2PC协调者提交阶段准备发送命令的时候挂了,参与者一直阻塞等待的情况),并且新增了一个阶段使得故障恢复之后协调者的决策复杂度降低(解决2PC的不确定性,在将要发生不确定性时,新协调者发现有一个参与者处于预提交或者提交阶段,那么表明已经经过了所有参与者的确认了,所以此时执行的就是提交命令)
场景:没有找到具体实现,偏理论。
2PC 和 3PC 都不能保证数据100%一致,因此一般都需要有定时扫描补偿机制。
TCC,2PC 和 3PC 都是数据库层面的,而 TCC 是业务层面的分布式事务。TCC指的是Try - Confirm - Cancel
- try,即资源的预留和锁定。
- Confirm,指的是确认操作,其实就是真正的执行。
- Cancel,指的时撤销操作,可以理解为撤销预留阶段的动作。
其也存在一个事务管理者,用来记录TCC全局事务状态提交或者回滚。其流程和2PC差不多。但业务的侵入较大、业务耦合度高,需要将原来一个接口可以实现的逻辑拆分为三个接口。
场景:TCC 需要提供三个接口,提高了编程的复杂性,并且依赖于业务方来配合提供这样的接口,推行难度大,所以一般不推荐使用这种方式。
本地消息表,利用各个系统本地事务来实现分布式事务。系统中会定义一个存放本地消息的表,一般都是放在数据库中。
大致流程:
- 当A被其他系统调用需要业务执行时,将业务的执行操作和将消息放入本地消息表中的操作放在同一个事务中。
- A定时轮询本地消息表往mq中生产消息,失败则重试。
- B消费mq中的消息,并处理业务逻辑,如果本地事务失败则重试,如果是业务失败则通知A进行回滚。
场景:跨行转账可通过该方案实现。在银行一的用户A向银行二的用户B转账
- 银行一:在一个本地事务中扣掉A的钱并将转账消息写入本地消息表中,如果本地事务失败则失败,如果本地事务成功,系统定时轮询消息表并往mq中生产转账消息,失败则重试。
- 银行二:mq 消息会被银行二消费并往 B 的账户增加转账金额,执行失败会不断重试。
消息事务,只有阿里的RocketMQ支持,实现了最终一致性。
大致流程:
- A向mq发送准备消息,失败则直接取消,成功则执行本地事务。
- 本地事务执行成功,向mq发送确认消息,失败则回滚消息。
- B定期消费mq中的确认消息,执行本地事务并回送ack消息,如果本地事务执行失败,会不断尝试,如果是业务失败,会向A发起回滚请求。
- mq会定期轮询所有准备消息,调用A提供的反查事务状态接口,如果该准备消息本地事务执行成功则重发确认消息,否者直接回滚。
场景:用户注册成功后发送邮件、电商系统给用户发送优惠券等需要保证最终一致性的场景。
最大努力通知,是最简单的一种柔性事务,适用于一些对最终一致性不敏感的业务,且被动方的处理结果,并不会影响主动方的处理结果。
大致流程:
- A本地事务执行完成之后,向MQ生产消息。
- 会存在一个服务消费MQ消息并调用系统B的接口。
- 如果B执行成功则OK,否则会一直尝试N次,超过则放弃。
场景:最常见的场景就是支付回调,支付服务收到第三方服务支付成功通知后,先更新自己库中订单支付状态,然后同步通知订单服务支付成功。如果此次同步通知失败,会通过异步脚步不断重试地调用订单服务的接口。
分布式Hash是什么?
我们从分布式系统中负载均衡的问题来描述分布式hash。
常见的负载均衡算法如下:
随机访问策略。随机访问,可能造成服务器负载压力不均衡。
轮询策略。请求均匀分配,但是浪费了性能高的服务器的资源。
权重轮询策略。根据权重轮询,权重需要静态配置,无法自动调节。
Hash取模策略。通过hash取模,伸缩性差,当新增或者下线服务器机器时候,用户与服务器的映射关系会大量失效。
一致性哈希策略。简单来说就是将整个哈希值(int范围)空间组织成一个虚拟的hash圆环,将每个服务器标识符跟int最大hash取模,得到一些对应在hash环上的点。用户在访问的时候,根据用户的标识符使用同样的hash函数取模,得到hash环上的一点,但这一点很可能没有服务器映射在上面,所以会顺时针行走,遇到的第一台服务器就是应该处理该用户请求的服务器。
优点:
- 可以任意动态添加、删除节点,每次添加、删除一个节点仅影响hash环上相邻的节点。
缺点:
- 会存在数据倾斜问题,因为hash值范围很大(int范围),用户请求量也很大(hash取模分布相对均匀),而服务器数量相对很少(hash取模分布很不均匀),就会造成数据倾斜问题。解决办法就是设置虚拟服务器,每个真实服务器映射很多个虚拟服务器,这样服务器数据大幅增加,hash取模分布相对均匀。