HDFS的高可用机制(HA)与Hadoop联邦机制(Federation)概述--688IT编程网

HDFS的⾼可⽤机制（HA）与Hadoop联邦机制（Federation）概述

背景

分布式⽂件系统中( HDFS，Hadoop Distributed File System )，NameNode在内存中存储着整个⽂件系统的元数据信息，如⽂件数据块的地址映射、⽂件系统的命名空间、⽂件操作权限等。倘若NameNode节点主机⼀旦宕机，整个集即将瘫痪

⾼可⽤的Hadoop集

在搭建Hadoop集时，通常需要搭建多个NameNode，这样可以保证如果其中⼀个NameNode发⽣宕机，另⼀个NameNode可以迅速的补充，保证集7*24⼩时的不间断⼯作。通常，NameNode有两个状态，分别是active(响应客户端请求)与standby（待命状态，在active 状态的NameNode宕机时迅速切换）

这⾥需要区分的是NameNode与SecondaryNameNode之间的关系，SecondaryNameNode只作为分担NameNode⼯作压⼒的⾓⾊，并不能在NameNode宕机时替代NameNode。为简短篇幅，NameNode以下简称“nn”

⾼可⽤HDFS⼯作原理

HA⾃动切换机制流程

1. HealthMonitor监控nn健康状况，将结果反馈给ZKFC

2. 若nn状态出现异常，ZKFC将nn异常状况报告给ASE

3. ASE通知Zookeeper选举出新的NameNode

4. Zookeeper将选举结果返回给ASE

5. ASE向ZKFC报告选举结果

6. ZKFC完成nn间的状态切换

下⾯对各个模块进⾏说明

元数据共享存储系统

元数据共享存储系统由多个JournalNode构成。JournalNode中主要存放⽂件元数据信息,active-nn通过edits往JournalNode中写⼊⽇志数据,standby-nn负责从JournalNode中读取⽇志信息并⽣成元数据。为了保证数据不丢失，active-nn与standby-nn的元数据读写操作必须是同步的

ZKFC

ZKFC是基于Zookeeper的故障转移控制器，运⾏在每个nn中，⽤来监控nn的健康状态并在Active-nn出

现连接超时，宕机等连接失败的情况下通知ZooKeeper进⾏新的选举，完成active-nn与standby-nn间的主备切换，下⾯介绍ZKFC中的重要组件

1. HealthMonitor

ZKFC定期通过HealthMonitor对nn进⾏健康诊断，HealthMonitor负责记录nn的健康状态并向ZKFC进⾏反馈（nn状态正常或异常）

2. ActiveStandbyElectorhadoop分布式集搭建

ActiveStandByElector主要完成nn与Zookeeper间的交互，当nn在Zookeeper上的节点状态发⽣变化时，ASE负责将结果返回给ZKFC，与此同时，如果nn出现宕机，也由ASE通知Zookeeper完成选举

3. ZKFailoverController

ZKFailoverController负责协调HealthMonitor和ActiveStandbyElector对象，完成nn状态切换过程

DataNode

存储⽂件信息，定期向nn发送数据块信息，与nn建⽴⼼跳感知(向nn报告健康状况)

Hadoop的联邦机制(Federation)

背景

虽然⾼可⽤HDFS解决了nn单点故障问题，但是实际业务需求中随着业务量的增⼤，内存中的元数据会越来越多最终导致内存不⾜等问题联邦机制

为了解决内存不⾜的问题，Hadoop允许对nn进⾏横向扩展，也就是拥有多个nn，每个nn管理着各⾃的数据块。DataNode中不同的存储数据块由不同的nn进⾏管理，但因此也产⽣了问题，即联邦机制不能解决nn单点故障问题。所以，在部署环境时，应采⽤⾼可⽤(HA)+联邦机制的部署⽅案来搭建集。

688IT编程网

HDFS的高可用机制(HA)与Hadoop联邦机制(Federation)概述

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

HDFS的高可用机制(HA)与Hadoop联邦机制(Federation)概述

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式