Springboot+Sharding-JDBC分库分表实践四之一致性Hash算法--688IT编程网

Springboot+Sharding-JDBC 分库分表实践四之⼀致性Hash 算法

⽂章⽬录

前⾔

前⼏篇⽂章主要介绍了Springboot+Sharding-JDBC在分库分表中的实践，那么在实际场景中，我们可能会有需求对已经分表的表节点进⾏扩容。那么在分表算法为求余的情况下，如果增加⼀个节点，会导致⼤部分已存在的数据多要进⾏迁移，⼯程量巨⼤。

那除了求余分表算法外，还有其他算法能在缩扩容场景下更好的⼯作吗？！接下来我们⼀起看下⼀致性Hash算法在分库分表中的应⽤。⼀、⼀致性Hash 是什么？

⼀致性哈希算法在1997年由⿇省理⼯学院提出，是⼀种特殊的哈希算法，⽬的是解决分布式缓存的问题。在移除或者添加⼀个服务器时，能够尽可能⼩地改变已存在的服务请求与处理请求服务器之间的映射关系。⼀致性哈希解决了简单哈希算法在分布式哈希表(Distributed Hash Table，DHT) 中存在的动态伸缩等问题

⼀致性哈希算法将整个哈希值空间映射成⼀个虚拟的圆环，整个哈希空间的取值范围为0—-1。整个空间按顺时针⽅向组织。0—在零点中⽅向重合。接下来使⽤Hash算法对服务请求进⾏映射，将服务请求使

⽤哈希算法算出对应的hash值，然后根据hash值的位置沿圆环顺时针查，第⼀台遇到的服务器就是所对应的处理请求服务器。当增加⼀台新的服务器，受影响的数据仅仅是新添加的服务器到其环空间中前⼀台的服务器（也就是顺着逆时针⽅向遇到的第⼀台服务器）之间的数据，其他都不会受到影响。综上所述，⼀致性哈希算法对于节点的增减都只需重定位环空间中的⼀⼩部分数据，具有较好的容错性和可扩展性;

232232

那么在分表应⽤中，如下图，我们先对table1、table2、table3、table4进⾏hash计算得到key1、key2、key3、key4并映射到范围为0—-1的环中；加⼊此时我们是通过id进⾏分表操作，那么在存储时，我们先对id进⾏hash计算得出hahs值（hash(id1)），得到的值沿

圆环顺时针查遇到的第⼀个表节点，即是数据存储的真实表结点；接下来我们看下在Sharding-jdbc中的实际应⽤springboot推荐算法

⼆、使⽤步骤

1.⼀致性hash 算法

ConsistentHashAlgorithm

public class ConsistentHashAlgorithm {

//虚拟节点，key 表⽰虚拟节点的hash 值，value 表⽰虚拟节点的名称

@Getter

private SortedMap <Long , String > virtualNodes = new TreeMap <>();

//当节点的数⽬很少时，容易造成数据的分布不均，所以增加虚拟节点来平均数据分布

//虚拟节点的数⽬；虚拟节点的⽣成主要是⽤来让数据尽量均匀分布

//虚拟节点是真实节点的不同映射⽽已

//⽐如真实节点user1的hash 值为100，那么我们增加3个虚拟节点user1-1、user1-2、user1-3，分别计算出来的hash 值可能就为200，345，500；通过这种⽅式来将节点分布均匀

private static final int VIRTUAL_NODES = 3;

public ConsistentHashAlgorithm () {

}

public ConsistentHashAlgorithm (SortedMap <Long , String > virtualTableNodes , Collection <String > tableNodes ) {

if (Objects .isNull (virtualTableNodes )) {

virtualTableNodes = initNodesToHashLoop (tableNodes );

}

232

this.virtualNodes = virtualTableNodes;

}

public SortedMap<Long, String>initNodesToHashLoop(Collection<String> tableNodes){ SortedMap<Long, String> virtualTableNodes =new TreeMap<>();

for(String node : tableNodes){

for(int i =0; i < VIRTUAL_NODES; i++){

String s = String.valueOf(i);

String virtualNodeName = node +"-VN"+ s;

long hash =getHash(virtualNodeName);

virtualTableNodes.put(hash, virtualNodeName);

}

return virtualTableNodes;

}

/**

* 通过计算key的hash

* 计算映射的表节点

* @param key

* @return

public String getTableNode(String key){

String virtualNode =getVirtualTableNode(key);

//虚拟节点名称截取后获取真实节点

if(StringUtils.isNotBlank(virtualNode)){

return virtualNode.substring(0, virtualNode.indexOf("-"));

}

return null;

}

/**

* 获取虚拟节点

* @param key

* @return

public String getVirtualTableNode(String key){

long hash =getHash(key);

// 得到⼤于该Hash值的所有Map

SortedMap<Long, String> subMap = virtualNodes.tailMap(hash);

String virtualNode;

if(subMap.isEmpty()){

//如果没有⽐该key的hash值⼤的，则从第⼀个node开始

Long i = virtualNodes.firstKey();

//返回对应的服务器

virtualNode = (i);

}else{

//第⼀个Key就是顺时针过去离node最近的那个结点

Long i = subMap.firstKey();

//返回对应的服务器

virtualNode = (i);

}

return virtualNode;

}

/**

* 使⽤FNV1_32_HASH算法计算key的Hash值

* @param key

* @return

public long getHash(String key){

final int p =16777619;

int hash =(int)2166136261L;

for(int i =0; i < key.length(); i++)

hash =(hash ^ key.charAt(i))* p;

hash += hash <<13;

hash ^= hash >>7;

hash += hash <<3;

hash ^= hash >>17;

hash += hash <<5;

// 如果算出来的值为负数则取其绝对值

if(hash <0)

hash = Math.abs(hash);

return hash;

}

2.初始化表结点，并映射到hash环

该步骤会在应⽤启动时初始化分表的表结点，提前进⾏hash计算InitTableNodesToHashLoop

public class InitTableNodesToHashLoop {

@Resource

private ShardingDataSource shardingDataSource;

@Getter

private HashMap<String, SortedMap<Long, String>> tableVirtualNodes =new HashMap<>();

@PostConstruct

public void init(){

try{

ShardingRule rule = RuntimeContext().getRule();

Collection<TableRule> tableRules = TableRules();

ConsistentHashAlgorithm consistentHashAlgorithm =new ConsistentHashAlgorithm();

for(TableRule tableRule : tableRules){

String logicTable = LogicTable();

tableVirtualNodes.put(logicTable,

consistentHashAlgorithm.initNodesToHashLoop(

.stream()

.map(DataNode::getTableName)

.List()))

);

}

}catch(Exception e){

<("分表节点初始化失败 {}", e);

}

3.创建分表算法

ConsistentShardingAlgorithm

public class ConsistentShardingAlgorithm

implements PreciseShardingAlgorithm<Long>, RangeShardingAlgorithm<Long>{

/**

* 精确分⽚

* ⼀致性hash算法

@Override

public String doSharding(Collection<String> availableTargetNames, PreciseShardingValue<Long> shardingValue){

//获取已经初始化的分表节点

InitTableNodesToHashLoop initTableNodesToHashLoop =

if(CollectionUtils.isEmpty(availableTargetNames)){

LogicTableName();

}

//这⾥主要为了兼容当联表查询时，如果两个表⾮关联表则

//当对副表分表时shardingValue这⾥传递进来的依然是主表的名称，

//但availableTargetNames中确是副表名称，所有这⾥要从availableTargetNames中匹配真实表

ArrayList<String> availableTargetNameList =new ArrayList<>(availableTargetNames);

String logicTableName = (0).replaceAll("[^(a-zA-Z_)]","");

SortedMap<Long, String> tableHashNode =

ConsistentHashAlgorithm consistentHashAlgorithm =new ConsistentHashAlgorithm(tableHashNode,

availableTargetNames);

TableNode(String.Value()));

}

/**

* 范围查询规则

* 可以根据实际场景进⾏修改

* Sharding.

* @param availableTargetNames available data sources or tables's names

* @param shardingValue sharding value

* @return sharding results for data sources or tables's names

@Override

public Collection<String>doSharding(Collection<String> availableTargetNames, RangeShardingValue<Long> shardingValue){

return availableTargetNames;

}

4.更改配置

tables:

t_user:#t_user表

key-generator-column-name: id #主键

actual-data-nodes: ds0.t_user${0..39}#数据节点，均匀分布

table-strategy:#分表策略使⽤⼀致性hash算法

standard:

sharding-column: id

precise-algorithm-class-name: sharding.infrastruc.shardingAlgorithm.ConsistentShardingAlgorithm

总结

以上即是⼀致性hash算法在分表分库中的实际应⽤；虽然⼀致性hash算法能在节点伸缩的时候尽量减少数据的迁移，但是当虚拟节点数量很多时依然会造成不少数据迁移，所以前期进⾏规划时⼀定要考虑虚拟节点的倍数设置。

Demo地址：

688IT编程网

Springboot+Sharding-JDBC分库分表实践四之一致性Hash算法

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

688IT编程网

Springboot+Sharding-JDBC分库分表实践四之一致性Hash算法

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林 重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

随机森林重要性