分布式ID生成算法 - 雪花算法SnowFlake

淩亂°似流年 2022-02-16 14:54 430阅读 0赞

1. 背景

Twitter-Snowflake算法产生的背景相当简单,为了满足Twitter每秒上万条消息的请求,每条消息都必须分配一条唯一的id,这些id还需要一些大致的顺序(方便客户端排序),并且在分布式系统中不同机器产生的id必须不同。

Twitter的分布式雪花算法 SnowFlake 每秒自增生成26个万个可排序的ID

1、twitter的SnowFlake生成ID能够按照时间有序生成
2、SnowFlake算法生成id的结果是一个64bit大小的整数
3、分布式系统内不会产生重复id(用有datacenterId和workerId来做区分)

2. Snowflake算法核心

把时间戳,工作机器id,序列号组合在一起

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0FraXJhTmlja3k_size_16_color_FFFFFF_t_70

3. 适用场景

生成分布式ID(纯数字,时间顺序),订单编号等

4. 代码实现

  1. package com.yuyi.test;
  2. public class SnowFlake {
  3. /**
  4. * 起始的时间戳
  5. */
  6. private final static long START_STMP = 1480166465631L;
  7. /**
  8. * 每一部分占用的位数
  9. */
  10. private final static long SEQUENCE_BIT = 12; //序列号占用的位数
  11. private final static long MACHINE_BIT = 5; //机器标识占用的位数
  12. private final static long DATACENTER_BIT = 5;//数据中心占用的位数
  13. /**
  14. * 每一部分的最大值
  15. */
  16. private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);
  17. private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);
  18. private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);
  19. /**
  20. * 每一部分向左的位移
  21. */
  22. private final static long MACHINE_LEFT = SEQUENCE_BIT;
  23. private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;
  24. private final static long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;
  25. private long datacenterId; //数据中心
  26. private long machineId; //机器标识
  27. private long sequence = 0L; //序列号
  28. private long lastStmp = -1L;//上一次时间戳
  29. /**
  30. * 构造函数
  31. * @param datacenterId (0~31)
  32. * @param machineId (0~31)
  33. */
  34. public SnowFlake(long datacenterId, long machineId) {
  35. if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {
  36. throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");
  37. }
  38. if (machineId > MAX_MACHINE_NUM || machineId < 0) {
  39. throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");
  40. }
  41. this.datacenterId = datacenterId;
  42. this.machineId = machineId;
  43. }
  44. /**
  45. * 产生下一个ID(该方法是线程安全的)
  46. * @return
  47. */
  48. public synchronized long nextId() {
  49. long currStmp = getNewstmp();
  50. // 如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
  51. if (currStmp < lastStmp) {
  52. throw new RuntimeException("Clock moved backwards. Refusing to generate id");
  53. }
  54. // 如果是同一时间生成的,则进行毫秒内序列
  55. if (currStmp == lastStmp) {
  56. // 相同毫秒内,序列号自增
  57. sequence = (sequence + 1) & MAX_SEQUENCE;
  58. // 同一毫秒的序列数已经达到最大(毫秒内序列溢出)
  59. if (sequence == 0L) {
  60. // 阻塞到下一个毫秒,获得新的时间戳
  61. currStmp = getNextMill();
  62. }
  63. } else {
  64. //不同毫秒内,序列号置为0(时间戳改变,毫秒内序列重置)
  65. sequence = 0L;
  66. }
  67. // 上次生成ID的时间截
  68. lastStmp = currStmp;
  69. // 移位并通过或运算拼到一起组成ID
  70. return (currStmp - START_STMP) << TIMESTMP_LEFT //时间戳部分
  71. | datacenterId << DATACENTER_LEFT //数据中心部分
  72. | machineId << MACHINE_LEFT //机器标识部分
  73. | sequence; //序列号部分
  74. }
  75. private long getNextMill() {
  76. long mill = getNewstmp();
  77. while (mill <= lastStmp) {
  78. mill = getNewstmp();
  79. }
  80. return mill;
  81. }
  82. private long getNewstmp() {
  83. return System.currentTimeMillis();
  84. }
  85. public static void main(String[] args) {
  86. SnowFlake snowFlake = new SnowFlake(1, 1);
  87. long start = System.currentTimeMillis();
  88. for (int i = 0; i < 1; i++) {
  89. System.out.println(snowFlake.nextId());
  90. }
  91. System.out.println(System.currentTimeMillis() - start);
  92. }
  93. }

生成10000个id,只用了0.136秒!

发表评论

表情:
评论列表 (有 0 条评论,430人围观)

还没有评论,来说两句吧...

相关阅读

    相关 分布式ID生成-雪花算法

    为什么要用雪花算法? 生成有顺序的id,提高数据库的性能,现在大部分都不用uuid作为主键,因为不规则,每向数据库插入一条数据就要重新排列,使数据库性能降低。