• 面试题之分布式锁相关


    腾讯云后台开发 暑期实习一面

    一、问题

    大概题目:
    一个系统,多个分布于全国的子系统,一个前端点击从各个子系统拉取数据到主系统,可能会碰到什么问题?
    如果一个请求未结束,另外一个又发起,如何解决?
    如果主系统前端请求,后台又有定时任务执行相同的代码逻辑,怎么处理?

    交流上出了一点问题,虽然面试官一直有引导,自己还是没回答到点子上。
    应该是考查分布式系统里的多个任务调度,用分布式锁来进行同步。
    最后面试官说:你可以考虑用分布式锁来解决。

    :能力有限,以下是针对分布式锁的一些不太完整的总结

    二、分布式锁

    1、应用场景

    在分布式系统里,有时执行定时任务,或者处理某些并发请求,涉及到多个进程之间的同步,需要确保多点系统里同时只有一个执行线程进行处理。分布式锁就是在分布式系统里互斥访问资源的解决方案。

    2、单机锁和分布式锁的区别

    单机上锁可以用一个变量表示,0表示没有线程获取锁,而1表示有线程获取锁了。加锁需要判断变量的值,如果为0,将其设置为1,释放锁需要将变量的值设置为0。分布式下,锁变量也可以用一个变量表示,不过需要用一个共享存储系统来维护变量。

    所以分布式锁就有了如下要求:

    • 分布式锁的加锁和释放设计多个操作,需要保证操作的原子性。
    • 共享存储系统保存了锁变量,因此如果系统故障,要避免客户端无法加锁,也要保证系统的可靠性。

    分布式锁的实现方案有多种,主要介绍,基于redis和mysql实现的方案。

    三、基于redis实现

    redis因为可以组成redis集群,所以针对redis的分布式锁可以通过添加到单个redis节点也可以添加到多个redis节点。

    1、基于单个redis节点的分布式锁

    用一个变量和锁变量的值分别作为键值对的键和值。

    因为redis是单线程处理请求,所以即使客户端A和C的加锁请求同时发送给Redis,redis也会串行处理他们的请求。

    加锁要涉及到三个操作

    • 读取锁变量
    • 判断锁变量的值
    • 将锁变量的值设置位1

    redis提供单命令SETNX要将加锁这三个操作保证原子性执行。同样DEL对应删除锁。
    使用SETNX和DEL问题

    • 如果加锁之后,持续占用锁,就会造成其他客户端无法获取锁因而无法访问共享数据,所以要给锁设置一个过期时间,过期即自动释放
    • 比如A加锁,但是C错误发送DEL命令导致锁被错误释放。所以要使用参数区分来自不同客户端的加锁操作。

    使用SET命令加参数作为加锁命令,同时参数位失效时间,客户端字符串唯一标识符。
    对于释放锁使用Lua脚本,Lua脚本传入客户端标识符参数获取锁,然后释放锁。Lua脚本也保证操作原子性。

    但是如果用一个redis实例保存锁,如果这个redis故障,锁变量就没了,客户端无法获取锁而阻塞业务暂停。

    2、基于多个节点的高可靠redis分布式锁

    按照一定的规则步骤加锁解锁。分布式锁算法。
    基本思路,就是让客户端和多个独立的reids依次请求加锁,如果半数以上实例都能成功加锁,就认为可以获取分布式锁,否则失败。这样如果单个redis故障,锁变量在其他实例也有后保存,客户端仍旧可以正常锁操作。

    步骤
    1、客户端获取当前时间
    2、客户端顺序向N个redis实例发送set命令执行加锁操作,给单个客户端发送加锁,可能加锁超时,就会和下一个redis实例请求加锁,加锁时间远远小于锁的有效时间
    3、客户端和所有的redis完成加锁,就计算加锁的总耗时。

    • 当从半数以上的redis都获取锁
    • 获取锁的耗时小于锁的有效时间

    满足以上两个条件才认为加锁成功,然后开始计算剩余有效时间,如果有效时间来不及完成操作,就释放锁,避免操作还未完成锁就过期了。释放锁同样使用lua脚本。

    四、基于mysql实现

    1、基于唯一索引insert实现

    建立一个表,然后主键是锁的名字,获取锁就是根据锁的名字往表里插入数据。如果想往表中重复插入相同的记录,也就是重复获锁,就会因为主键冲突而报错,导致获取锁失败。

    实现方式

    • 获取锁时在数据库中insert一条数据,包括id、方法名(唯一索引)、线程名(用于重入)、重入计数等字段
    • 获取锁如果成功则返回true
    • 获取锁的动作放在while循环中,周期性尝试获取锁直到结束或者可以定义方法来限定时间内获取锁
    • 释放锁的时候,delete对应的数据

    优点:实现简单,容易理解。

    缺点:

    • 没有线程唤醒并且是非阻塞,insert插入失败表示锁获取失败,一般不会再去主动重复获取锁。
    • 没有超时保护,解锁操作失败,可能导致锁记录一直在数据库中,其他线程无法再获得到锁。
    • 这把锁强依赖数据库的可用性,数据库是一个单点,一旦数据库挂掉,会导致业务系统不可用。
    • 这把锁是非公平锁,所有等待锁的线程凭运气去争夺锁。

    2、乐观锁实现

    之所以称为乐观,是基于先默认没有加锁,先去拿数据,当把修改的数据往数据库写的时候,再做判断,相当于延迟获取锁。这个过程称为CAS过程,一般是通过为数据库表添加一个 version 字段来实现读取出数据时,将此版本号一同读出之后更新时,对此版本号加1,在更新过程中,会对版本号进行比较,如果是一致的,则说明数据没有被其他线程更改,则会成功执行本次操作;如果版本号不一致,则会更新失败,放弃操作。

    优点:实现也比较简单,容易理解

    缺点:

    • 本来只用更新数据,现在还要维护一个额外的版本号字段,对其进行比较和修改,增加了数据库额外的操作。
    • 数据库有多张表,多个资源,就需要对数据都建立基于数据表的乐观锁,也就是每个资源都要有一张资源表,对数据库的开销较大。
    • 多线程如果都是用乐观锁的过程中,会导致数据库中存在许多脏数据。

    3、基于mysql实现的分布式锁总结

    基于MySQL实现的分布式锁方案,性能上肯定是不如Redis。所以,基于Mysql实现分布式锁,适用于对性能要求不高,并且不希望因为要使用分布式锁而引入新组件。并且使用mysql分布式锁,必须保证多个服务节点使用的是同一个mysql库。

    优点

    • 直接借助DB简单快捷,基本每个服务都会直接连接数据库,而不是额外是用中间件,如redis。
    • 如果一个客户端断线了会自动释放锁,不会造成锁一直被占用

    缺点

    • 加锁直接打到数据库,增加了数据库的压力;
    • 锁的可用性和数据库强关联,一旦数据库挂了,则整个分布式锁不可用;可使用主从备份模式
    • 直接使用DB虽然简单,但是有性能瓶颈,超时问题等
  • 相关阅读:
    黄聪:解决Web部署 svg/woff/woff2字体 404错误
    黄聪:C#中HtmlAgilityPack判断是否包含或不包含指定的属性或值
    黄聪:GeckoFX如何引用jquery文件并执行自定义JS
    黄聪:css3实现图片划过一束光闪过效果(图片光影掠过效果)
    黄聪:C#带cookie模拟登录百度
    黄聪:如何为IIS增加svg和woff等字体格式的MIME
    黄聪:微信支付错误两个问题的解决:curl出错,错误码:60
    黄聪:《跟黄聪学WordPress插件开发》
    黄聪:GeckoWebBrowser多窗口独立cookie
    黄聪:远程连接mysql数据库注意事项记录(远程连接慢skip-name-resolve)
  • 原文地址:https://www.cnblogs.com/welan/p/16319337.html
Copyright © 2020-2023  润新知