• Snowflake算法 ID生成


    Snowflake算法 ID生成

    http://blog.csdn.net/w200221626/article/details/52064976
    使用UUID或者GUID产生的ID没有规则

    Snowflake算法是Twitter的工程师为实现递增而不重复的ID实现的
    img_name
    从图上看除了第一位不可用之外其它三组均可浮动站位,据说前41位就可以支撑到2088年,10位的可支持1023台机器,最后12位序列号可以在1毫秒内产生4095个自增的ID。
    数据中主键有多种方式:数据库自增、程序生成。程序生成一般采用的是snowflake 算法。这个算法在网上有很多解释,这里就不做过多的解释。

    生成的id大致有以下组成:

    Snowflake算法一般生成的每一个ID都是64位的整型数,它的核心算法也比较简单高效,结构如下:

    41位的时间序列,精确到毫秒级,41位的长度可以使用69年。时间位还有一个很重要的作用是可以根据时间进行排序。

    5位的数据中心标识,5位的长度最多支持部署32个节点。

    5位的机器标识,8位的长度最多支持部署255个节点。

    12位的计数序列号,序列号即一系列的自增id,可以支持同一节点同一毫秒生成多个ID序号,12位的计数序列号支持每个节点每毫秒产生4095个ID序号。

    最高位是符号位,始终为0,不可用。

    根据生成规则和实际代码:
    (有关算法详解:https://segmentfault.com/a/1190000011282426#articleHeader2)

    在多线程中使用要加锁。
    C# 实现 Snowflake算法
    img_name

    /// <summary>
        /// 动态生产有规律的ID Snowflake算法是Twitter的工程师为实现递增而不重复的ID实现的
        /// http://blog.csdn.net/w200221626/article/details/52064976     
        /// C# 实现 Snowflake算法 
        /// </summary>
        public class Snowflake
        {
            private static long machineId;//机器ID
            private static long datacenterId = 0L;//数据ID
            private static long sequence = 0L;//计数从零开始
    
            private static long twepoch = 687888001020L; //唯一时间随机量
    
            private static long machineIdBits = 5L; //机器码字节数
            private static long datacenterIdBits = 5L;//数据字节数
            public static long maxMachineId = -1L ^ -1L << (int)machineIdBits; //最大机器ID
            private static long maxDatacenterId = -1L ^ (-1L << (int)datacenterIdBits);//最大数据ID
    
            private static long sequenceBits = 12L; //计数器字节数,12个字节用来保存计数码        
            private static long machineIdShift = sequenceBits; //机器码数据左移位数,就是后面计数器占用的位数
            private static long datacenterIdShift = sequenceBits + machineIdBits;
            private static long timestampLeftShift = sequenceBits + machineIdBits + datacenterIdBits; //时间戳左移动位数就是机器码+计数器总字节数+数据字节数
            public static long sequenceMask = -1L ^ -1L << (int)sequenceBits; //一微秒内可以产生计数,如果达到该值则等到下一微妙在进行生成
            private static long lastTimestamp = -1L;//最后时间戳
    
            private static object syncRoot = new object();//加锁对象
            static Snowflake snowflake;
    
            public static Snowflake Instance()
            {
                if (snowflake == null)
                    snowflake = new Snowflake();
                return snowflake;
            }
    
            public Snowflake()
            {
                Snowflakes(0L, -1);
            }
    
            public Snowflake(long machineId)
            {
                Snowflakes(machineId, -1);
            }
    
            public Snowflake(long machineId, long datacenterId)
            {
                Snowflakes(machineId, datacenterId);
            }
    
            private void Snowflakes(long machineId, long datacenterId)
            {
                if (machineId >= 0)
                {
                    if (machineId > maxMachineId)
                    {
                        throw new Exception("机器码ID非法");
                    }
                    Snowflake.machineId = machineId;
                }
                if (datacenterId >= 0)
                {
                    if (datacenterId > maxDatacenterId)
                    {
                        throw new Exception("数据中心ID非法");
                    }
                    Snowflake.datacenterId = datacenterId;
                }
            }
    
            /// <summary>
            /// 生成当前时间戳
            /// </summary>
            /// <returns>毫秒</returns>
            private static long GetTimestamp()
            {
                //让他2000年开始
                return (long)(DateTime.UtcNow - new DateTime(2000, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds;
            }
    
            /// <summary>
            /// 获取下一微秒时间戳
            /// </summary>
            /// <param name="lastTimestamp"></param>
            /// <returns></returns>
            private static long GetNextTimestamp(long lastTimestamp)
            {
                long timestamp = GetTimestamp();
                int count = 0;
                while (timestamp <= lastTimestamp)//这里获取新的时间,可能会有错,这算法与comb一样对机器时间的要求很严格
                {
                    count++;
                    if (count > 10)
                        throw new Exception("机器的时间可能不对");
                    Thread.Sleep(1);
                    timestamp = GetTimestamp();
                }
                return timestamp;
            }
    
            /// <summary>
            /// 获取长整形的ID
            /// </summary>
            /// <returns></returns>
            public long GetId()
            {
                lock (syncRoot)
                {
                    long timestamp = GetTimestamp();
                    if (Snowflake.lastTimestamp == timestamp)
                    { //同一微妙中生成ID
                        sequence = (sequence + 1) & sequenceMask; //用&运算计算该微秒内产生的计数是否已经到达上限
                        if (sequence == 0)
                        {
                            //一微妙内产生的ID计数已达上限,等待下一微妙
                            timestamp = GetNextTimestamp(Snowflake.lastTimestamp);
                        }
                    }
                    else
                    {
                        //不同微秒生成ID
                        sequence = 0L;
                    }
                    if (timestamp < lastTimestamp)
                    {
                        throw new Exception("时间戳比上一次生成ID时时间戳还小,故异常");
                    }
                    Snowflake.lastTimestamp = timestamp; //把当前时间戳保存为最后生成ID的时间戳
                    long Id = ((timestamp - twepoch) << (int)timestampLeftShift)
                        | (datacenterId << (int)datacenterIdShift)
                        | (machineId << (int)machineIdShift)
                        | sequence;
                    return Id;
                }
            }
    
        }
    复制代码
    复制代码
        [TestClass]
        public class SnowflakeUnitTest1
        {
            /// <summary>
            /// 动态生产有规律的ID Snowflake算法是Twitter的工程师为实现递增而不重复的ID实现的
            /// </summary>
            [TestMethod]
            public void SnowflakeTestMethod1()
            {
                var ids = new List<long>();
                for (int i = 0; i < 1000000; i++)//测试同时100W有序ID
                {
                    ids.Add(Snowflake.Instance().GetId());
                }
                for (int i = 0; i < ids.Count - 1; i++)
                {
                    Assert.IsTrue(ids[i] < ids[i+1]);
                }
            }
        }
    
    namespace ConsoleApplicationTester
    {
        class Program
        {
            static void Main(string[] args)
            {
                for (int i = 0; i < 1000; i++)
                {
                    Console.WriteLine("开始执行 " + DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss:ffffff") + "    " + Snowflake.Instance().GetId());
    
                    Console.WriteLine("Snowflake.maxMachineId:" + Snowflake.maxMachineId);
                }
            }
        }
    }
    
    

    “雪花”项目:Microsoft探索在.NET中实现手工内存管理

    http://www.infoq.com/cn/news/2017/09/snowflake

    来自Microsoft研究院、剑桥大学和普林斯顿大学的一些研究人员构建了一个.NET的分支,实现了在运行时中添加支持手工内存管理的API。研究方法的细节及所获得的性能提升发表在名为“Project Snowflake: Non-blocking Safe Manual Memory Management in .NET”(“雪花”项目:非阻塞的、安全的.NET手工内存管理)的论文中。

    “雪花“项目意在实现.NET中的手工内存管理,这一改进被认为对一些应用是非常有用。C#、.NET等现代编程语言都采用了垃圾回收机制,使编程人员得以从管理对象的任务中解放出来,这一机制的优点广为人知,涉及提高生产力、改进程序稳定性、内存安全及防止恶意操作等方面。但是垃圾回收机制需要付出一些性能上的代价,尽管这在很多情况下不易被察觉,但是在一些情况下还是存在问题的。“雪花”项目的研究人员就指出,对于在具有上百GB堆内存的系统上运行数据分析和流处理任务,就可受益于手工内存管理。

    “雪花”项目所引入的手工内存管理是与垃圾回收机制并行工作的,开发人员一般情况下使用的是垃圾回收机制,但在环境需要时也可以选择手工内存管理。该引入到运行时中的改进并不会对已有应用产生影响,并且会改进多线程应用的性能。“雪花”项目实现了“在程序任一位置分配和释放独立对象,并确保手工管理对象同样享有完全的类型安全和时序安全,即使存在并发访问时。”

    “雪花”中提出了两个新概念,即对象“所有者”(Owner)和“护盾”(Shield),它们实现为CoreCLR和CoreFX层级的API。“所有者”表示了栈或堆中的一个位置,保存了对手工堆中分配对象的唯一引用。“所有者”获取自“护盾”,而引入“护盾”是为了避免手工对象在被多个线程访问时重分配(deallocate)。“护盾”确保了当最后使用一个对象的线程重分配该对象后,才从堆中移除该对象。论文中是如下详细阐述该机制的:

    我们的解决方案……受到了无锁数据结构研究中的“风险指针”(Hazard Pointer)这一概念的启发。我们引入了一种机制,当线程想要通过其中一个“所有者”位置访问手工对象时,这一意图将会发布在线程本地状态(TLS,Thread-Local State)中。此注册过程可看成是创建了一个“护盾”,该“护盾”将保护对象不会被重分配,并授权发布注册的线程可直接访问对象,例如调用对象的方法,或是转换(mutate)对象的字段。同时,不允许任何线程(同一线程或另一个线程)重分配对象及回收(reclaim)对象的内存。一旦客户代码不再需要访问该对象,就可以释放(dispose)“护盾”,即从对象的TLS中移除了指向该对象的引用。直接访问从“护盾”获取的对象是不安全的操作,因为在释放“护盾”后,实际的重分配操作依然允许继续。

    论文中提供了一系列给定场景下的测试结果,表明使用“雪花”项目的性能相比于垃圾回收机制取得了改进。其中,“在峰值工作集上获得了高达三倍的性能提高,在运行时上取得了两倍的性能提高”。测试结果给出了很好的性能改进。这是因为当对象池非常大时,垃圾回收为释放内存需要花费很多时间遍历对象图。

    Microsoft并未详述是否有规划在.NET中加入“雪花”项目。但考虑到这是一种非侵入式的和安全的机制,我们希望在.NET的未来版本中能集成类似的功能。

    查看英文原文: Microsoft Explores Manual Memory Management in .NET with Snowflake

  • 相关阅读:
    基于 mysql 异步驱动的非阻塞 Mybatis【待验证】
    Hive SQL优化方式及使用技巧
    使用Guava-RateLimiter限流控制qps
    hive 时间戳函数之unix_timestamp,from_unixtime
    Hive实现自增列的两种方法
    shell 下 urlencode/urldecode 编码/解码的方法
    awk使用shell变量,shell获取awk中的变量值
    shell脚本删除远程过期文件
    linux下多进程同时操作文件
    hive学习----Hive表的创建
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/9564773.html
Copyright © 2020-2023  润新知