• MySQL的id生成策略


    1 自增

    CREATE TABLE `test` (
    `id` int(11) NOT NULL AUTO_INCREMENT,
    PRIMARY KEY (`id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

    ---------------------------------------------------------------------------------

    问题1:单点问题,如果分表分库不能保证id唯一。

    解决1:部署两个(多个)数据库实例,设置自增步长为2(多个则为实例数),即auto-increment-increment = 2,设置auto-increment-offset分别为1,2.....
    这样第一台数据库服务器的自增id为 1 3 5 7 9,第二台为2 4 6 8 10。

    ---------------------------------------------------------------------------------

    问题2:自增锁(AUTO_INC锁)。mysql5.1.22之前,当表里有一个auto_increment字段的时候,innoDB会在内存里保存一个计数器用来记录auto_increment的值,当插入一个新行数据时,就会用一个表锁来锁住这个计数器,直到插入结束。如果大量的并发插入,表锁会引起SQL堵塞。

    解决1:id不使用自增,可以使用uuid等其他方式生成(后文详述)。

    解决2:在mysql5.1.22之后,InnoDB为了解决自增主键锁表的问题,引入了参数innodb_autoinc_lock_mode,该实现方式是通过轻量级互斥量的增长机制完成的。用来在使用auto_increment的情况下调整锁策略。该参数可以设置三个值:0、1、2

    0:traditonal 通过表锁的方式进行,所有类型的insert都用AUTO-inc locking。
    
    1:consecutive 默认值,产生一个轻量锁,对于simple insert 自增长值的产生使用互斥量对内存中的计数器进行累加操作,对于bulk insert 则还是使用表锁的方式进行。
    
    2:interleaved 对所有的insert-like 自增长值的产生使用互斥量机制完成,并发性能最高,并发插入可能导致自增值不连续,可能会导致Statement 的 Replication 出现不一致,使用该模式,需要用 Row Replication的模式。

    2 UUID

    点击uuid详情

    优点:没有自增锁的问题,也没有单点问题,实现简单。

    问题:由于UUID非常的长,除占用大量存储空间外,最主要的问题是在索引上,在建立索引和基于索引进行查询时都存在性能问题。

    3 自己维护一个Sequence表

    CREATE TABLE `SEQUENCE` (  
        `table_name` varchar(18) NOT NULL,  
        `nextid` bigint(20) NOT NULL,  
        PRIMARY KEY (`table_name`)  
    ) ENGINE=InnoDB

    每当需要为某个表的新纪录生成ID时就从Sequence表中取出对应表的nextid,并将nextid的值加1后更新到数据库中以备下次使用。

    优点:没有自增锁问题。

    问题:由于所有插入任何都需要访问该表,该表很容易成为系统性能瓶颈,同时它也存在单点问题,一旦该表数据库失效,整个应用程序将无法工作。

    解决:使用Master-Slave进行主从同步,但这也只能解决单点问题,并不能解决读写比为1:1的访问压力问题。

    4 twitter的snowflake算法

    介绍:分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。

    有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移到Cassandra,因为Cassandra没有顺序ID生成机制,所以开发了这样一套全局唯一ID生成服务。

    snowflake的结构如下(每部分用-分开):

    0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000

    第一位为未使用,接下来的41位为毫秒级时间(41位的长度可以使用69年),然后是5位datacenterId和5位workerId(10位的长度最多支持部署1024个节点) ,最后12位是毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号),一共加起来刚好64位,为一个Long型。(转换成字符串后长度最多19)。

    snowflake生成的ID整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由datacenter和workerId作区分),并且效率较高。经测试snowflake每秒能够产生26万个ID。

    参考:https://www.cnblogs.com/jshen/p/7682502.html

    https://www.cnblogs.com/relucent/p/4955340.html

  • 相关阅读:
    优雅的使用Python之软件管理
    优雅的使用python之环境管理
    SpriteSheet精灵动画引擎
    【译】AS3利用CPU缓存
    走在网页游戏开发的路上(十一)
    自定义路径创建Cocos2d-x项目
    C++静态库与动态库
    C++对象模型
    超时空英雄传说2复仇魔神完全攻略&秘技
    从头写个http client(java)
  • 原文地址:https://www.cnblogs.com/ouym/p/8572506.html
Copyright © 2020-2023  润新知