利⽤mysql实现的雪花算法案例
⼀、为何要⽤雪花算法
1、问题产⽣的背景
现如今越来越多的公司都在⽤分布式、微服务,那么对应的就会针对不同的服务进⾏数据库拆分,然后当数据量上来的时候也会进⾏分表,那么随之⽽来的就是分表以后id的问题。
例如之前单体项⽬中⼀个表中的数据主键id都是⾃增的,mysql是利⽤autoincrement来实现⾃增,⽽oracle是利⽤序列来实现的,但是当单表数据量上来以后就要进⾏⽔平分表,阿⾥java开发
建议是单表⼤于500w的时候就要分表,但是具体还是得看业务,如果索引⽤的号的话,单表千万的数据也是可以的。⽔平分表就是将⼀张表的数据分成多张表,那么问题就来了如果还是按照以前的⾃增来做主键id,那么就会出现id重复,这个时候就得考虑⽤什么⽅案来解决分布式id的问题了。
2、解决⽅案
2.1、数据库表
可以在某个库中专门维护⼀张表,然后每次⽆论哪个表需要⾃增id的时候都去查这个表的记录,然后⽤for update锁表,然后取到的值加⼀,然后返回以后把再把值记录到表中,但是这个⽅法
mysql下载32位适合并发量⽐较⼩的项⽬,因此每次都得锁表。
2.2、redis
因为redis是单线程的,可以在redis中维护⼀个键值对,然后哪个表需要直接去redis中取值然后加⼀,但是这个跟上⾯⼀样由于单线程都是对⾼并发的⽀持不⾼,只适合并发量⼩的项⽬。
2.3、uuid
可以使⽤uuid作为不重复主键id,但是uuid有个问题就是其是⽆序的字符串,如果使⽤uuid当做主键,那么主键索引就会失效。
2.4、雪花算法
雪花算法是解决分布式id的⼀个⾼效的⽅案,⼤部分互联⽹公司都在使⽤雪花算法,当然还有公司⾃⼰实现其他的⽅案。
⼆、雪花算法
1、原理
雪花算法就是使⽤64位long类型的数据存储id,最⾼位⼀位存储0或者1,0代表整数,1代表负数,⼀般都是0,所以最⾼位不变,41位存储毫秒级时间戳,10位存储机器码(包括5位datacenterId和5位workerId),12存储序列号。这样最⼤2的10次⽅的机器,也就是1024台机器,最多每毫秒每台机器产⽣2的12次⽅也就是4096个id。(下⾯有代码实现)
但是⼀般我们没有那么多台机器,所以我们也可以使⽤53位来存储id。为什么要⽤53位?
因为我们⼏乎都是跟web页⾯打交道,就需要跟js打交道,js⽀持最⼤的整型范围为53位,超过这个范围就会丢失精度,53之内可以直接由js读取,超过53位就需要转换成字符串才能保证js处
理正确。53存储的话,32位存储秒级时间戳,5位存储机器码,16位存储序列化,这样每台机器每秒可以⽣产65536个不重复的id。
2、缺点
由于雪花算法严重依赖时间,所以当发⽣服务器时钟回拨的问题是会导致可能产⽣重复的id。当然⼏乎没有公司会修改服务器时间,修改以后会导致各种问题,公司宁愿新加⼀台服务器也不愿意修改服务器时间,但是不排除特殊情况。
如何解决时钟回拨的问题?可以对序列化的初始值设置步长,每次触发时钟回拨事件,则其初始步长就加1w,可以在下⾯代码的第85⾏来实现,将sequence的初始值设置为10000。
三、代码实现
64位的代码实现:
package com.ylmon;
/**
* Twitter_Snowflake<br>
* SnowFlake的结构如下(每部分⽤-分开):<br>
* 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000 <br>
* 1位标识,由于long基本类型在Java中是带符号的,最⾼位是符号位,正数是0,负数是1,所以id⼀般是正数,最⾼位是0<br>
* 41位时间截(毫秒级),注意,41位时间截不是存储当前时间的时间截,⽽是存储时间截的差值(当前时间截 - 开始时间截)
* 得到的值),这⾥的的开始时间截,⼀般是我们的id⽣成器开始使⽤的时间,由我们程序来指定的(如下下⾯程序IdWorker类的startTime属性)。41位的时间截,可以使⽤69年,年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69<br> * 10位的数据机器位,可以部署在1024个节点,包括5位datacenterId和5位workerId<br>
* 12位序列,毫秒内的计数,12位的计数顺序号⽀持每个节点每毫秒(同⼀机器,同⼀时间截)产⽣4096个ID序号<br>
* 加起来刚好64位,为⼀个Long型。<br>
* SnowFlake的优点是,整体上按照时间⾃增排序,并且整个分布式系统内不会产⽣ID碰撞(由数据中⼼ID和机器ID作区分),并且效率较⾼,经测试,SnowFlake每秒能够产⽣26万ID左右。
*/
public class SnowflakeIdWorker {
// ==============================Fields===========================================
/** 开始时间截 (2020-01-01) */
private final long twepoch = 1577808000000L;
/** 机器id所占的位数 */
private final long workerIdBits = 5L;
/** 数据标识id所占的位数 */
private final long datacenterIdBits = 5L;
/** ⽀持的最⼤机器id,结果是31 (这个移位算法可以很快的计算出⼏位⼆进制数所能表⽰的最⼤⼗进制数) */
private final long maxWorkerId = -1L ^ (-1L << workerIdBits);
/** ⽀持的最⼤数据标识id,结果是31 */
private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
/** 序列在id中占的位数 */
private final long sequenceBits = 12L;
/** 机器ID向左移12位 */
private final long workerIdShift = sequenceBits;
/** 数据标识id向左移17位(12+5) */
private final long datacenterIdShift = sequenceBits + workerIdBits;
/** 时间截向左移22位(5+5+12) */
private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
/** ⽣成序列的掩码,这⾥为4095 (0b111111111111=0xfff=4095) */
private final long sequenceMask = -1L ^ (-1L << sequenceBits);
/** ⼯作机器ID(0~31) */
private long workerId;
/** 数据中⼼ID(0~31) */
private long datacenterId;
/** 毫秒内序列(0~4095) */
private long sequence = 0L;
/** 上次⽣成ID的时间截 */
private long lastTimestamp = -1L;
/
/==============================Constructors=====================================
/**
* 构造函数
* @param workerId ⼯作ID (0~31)
* @param datacenterId 数据中⼼ID (0~31)
*/
public SnowflakeIdWorker(long workerId, long datacenterId) {
if (workerId > maxWorkerId || workerId < 0) {
throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
}
if (datacenterId > maxDatacenterId || datacenterId < 0) {
throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId)); }
this.workerId = workerId;
this.datacenterId = datacenterId;
}
// ==============================Methods==========================================
/**
* 获得下⼀个ID (该⽅法是线程安全的)
* @return SnowflakeId
*/
public synchronized long nextId() {
long timestamp = timeGen();
//如果当前时间⼩于上⼀次ID⽣成的时间戳,说明系统时钟回退过这个时候应当抛出异常
if (timestamp < lastTimestamp) {
throw new RuntimeException(
String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}
//如果是同⼀时间⽣成的,则进⾏毫秒内序列
if (lastTimestamp == timestamp) {
sequence = (sequence + 1) & sequenceMask;
//毫秒内序列溢出
if (sequence == 0) {
//阻塞到下⼀个毫秒,获得新的时间戳
timestamp = tilNextMillis(lastTimestamp);
}
}
//时间戳改变,毫秒内序列重置
else {
sequence = 0L;
}
//上次⽣成ID的时间截
lastTimestamp = timestamp;
//移位并通过或运算拼到⼀起组成64位的ID
return ((timestamp - twepoch) << timestampLeftShift) //
| (datacenterId << datacenterIdShift) //
| (workerId << workerIdShift) //
| sequence;
}
/**
* 阻塞到下⼀个毫秒,直到获得新的时间戳
* @param lastTimestamp 上次⽣成ID的时间截
* @return 当前时间戳
*/
protected long tilNextMillis(long lastTimestamp) {
long timestamp = timeGen();
while (timestamp <= lastTimestamp) {
timestamp = timeGen();
}
return timestamp;
}
/**
* 返回以毫秒为单位的当前时间
* @return 当前时间(毫秒)
*/
protected long timeGen() {
return System.currentTimeMillis();
}
//==============================Test=============================================
/** 测试 */
public static void main(String[] args) {
SnowflakeIdWorker idWorker = new SnowflakeIdWorker(0, 0);
for (int i = 0; i < 100; i++) {
long id = Id();
System.out.println(id);
}
}
}
补充知识:雪花算法实现分布式⾃增长ID
我就废话不多说了,⼤家还是直接看代码吧~
/**
* <p>名称:IdWorker.java</p>
* <p>描述:分布式⾃增长ID</p>
* <pre>
* Twitter的 Snowflake JAVA实现⽅案
* </pre>
* 核⼼代码为其IdWorker这个类实现,其原理结构如下,我分别⽤⼀个0表⽰⼀位,⽤—分割开部分的作⽤:
* 1||0---0000000000 0000000000 0000000000 0000000000 0 --- 00000 ---00000 ---000000000000
* 在上⾯的字符串中,第⼀位为未使⽤(实际上也可作为long的符号位),接下来的41位为毫秒级时间,
* 然后5位datacenter标识位,5位机器ID(并不算标识符,实际是为线程标识),
* 然后12位该毫秒内的当前毫秒内的计数,加起来刚好64位,为⼀个Long型。
* 这样的好处是,整体上按照时间⾃增排序,并且整个分布式系统内不会产⽣ID碰撞(由datacenter和机器ID作区分),
* 并且效率较⾼,经测试,snowflake每秒能够产⽣26万ID左右,完全满⾜需要。
* <p>
* 64位ID (42(毫秒)+5(机器ID)+5(业务编码)+12(重复累加))
*
* @author Polim
*/
public class IdWorker {
// 时间起始标记点,作为基准,⼀般取系统的最近时间(⼀旦确定不能变动)
private final static long twepoch = 1288834974657L;
// 机器标识位数
private final static long workerIdBits = 5L;
// 数据中⼼标识位数
private final static long datacenterIdBits = 5L;
// 机器ID最⼤值
private final static long maxWorkerId = -1L ^ (-1L << workerIdBits);
// 数据中⼼ID最⼤值
private final static long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
/
/ 毫秒内⾃增位
private final static long sequenceBits = 12L;
// 机器ID偏左移12位
private final static long workerIdShift = sequenceBits;
// 数据中⼼ID左移17位
private final static long datacenterIdShift = sequenceBits + workerIdBits;
// 时间毫秒左移22位
private final static long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
private final static long sequenceMask = -1L ^ (-1L << sequenceBits);
/* 上次⽣产id时间戳 */
private static long lastTimestamp = -1L;
/
/ 0,并发控制
private long sequence = 0L;
private final long workerId;
// 数据标识id部分
private final long datacenterId;
public IdWorker(){
this.datacenterId = getDatacenterId(maxDatacenterId);
this.workerId = getMaxWorkerId(datacenterId, maxWorkerId);
}
/**
* @param workerId
* ⼯作机器ID
* @param datacenterId
* 序列号
*/
public IdWorker(long workerId, long datacenterId) {
if (workerId > maxWorkerId || workerId < 0) {
throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
}
if (datacenterId > maxDatacenterId || datacenterId < 0) {
throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
}
this.workerId = workerId;
this.datacenterId = datacenterId;
}
/**
* 获取下⼀个ID
*
* @return
*/
public synchronized long nextId() {
long timestamp = timeGen();
if (timestamp < lastTimestamp) {
throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp)); }
if (lastTimestamp == timestamp) {
// 当前毫秒内,则+1
sequence = (sequence + 1) & sequenceMask;
if (sequence == 0) {
// 当前毫秒内计数满了,则等待下⼀秒
timestamp = tilNextMillis(lastTimestamp);
}
} else {
sequence = 0L;
}
lastTimestamp = timestamp;
// ID偏移组合⽣成最终的ID,并返回ID
long nextId = ((timestamp - twepoch) << timestampLeftShift)
| (datacenterId << datacenterIdShift)
| (workerId << workerIdShift) | sequence;
return nextId;
}
private long tilNextMillis(final long lastTimestamp) {
long timestamp = this.timeGen();
while (timestamp <= lastTimestamp) {
timestamp = this.timeGen();
}
return timestamp;
}
private long timeGen() {
return System.currentTimeMillis();
}
/**
* <p>
* 获取 maxWorkerId
* </p>
*/
protected static long getMaxWorkerId(long datacenterId, long maxWorkerId) {
StringBuffer mpid = new StringBuffer();
mpid.append(datacenterId);
String name = RuntimeMXBean().getName();
if (!name.isEmpty()) {
/*
* GET jvmPid
*/
mpid.append(name.split("@")[0]);
}
/
*
* MAC + PID 的 hashcode 获取16个低位
*/
return (String().hashCode() & 0xffff) % (maxWorkerId + 1);
}
/**
* <p>
* 数据标识id部分
* </p>
*/
protected static long getDatacenterId(long maxDatacenterId) {
long id = 0L;
try {
InetAddress ip = LocalHost();
NetworkInterface network = ByInetAddress(ip);
if (network == null) {
id = 1L;
} else {
byte[] mac = HardwareAddress();
id = ((0x000000FF & (long) mac[mac.length - 1])
| (0x0000FF00 & (((long) mac[mac.length - 2]) << 8))) >> 6;
id = id % (maxDatacenterId + 1);
}
} catch (Exception e) {
System.out.println(" getDatacenterId: " + e.getMessage());
}
return id;
}
}
以上这篇利⽤mysql实现的雪花算法案例就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论