Hadoop云计算平台的研究及实现--688IT编程网

Hadoop云计算平台的研究及实现
作者：吴俊森
来源：《硅谷》2014年第15期

摘要随着电子商务的兴起，传统的服务器集技术在处理大数据时越来越显得力不从心。Hadoop是一种开源的云计算技术，包含HDFS文件系统及MapReduce编程模型两大核心，在处理海量数据、数据挖掘、电商推荐系统等领域有其独到的优势。文章介绍了Hadoop的基本原理，实现了搭建了Hadoop集，从而实现了一个基于Hadoop的云计算平台。

关键词 Hadoop；云计算；HDFS

中图分类号：TP3 文献标识码：A 文章编号：1671-7597（hadoop分布式集搭建2014）15-0051-02

在大数据时代，数据动辄以T级计算，传统的集技术已经难以存储、分析并处理如此大量的数据。为了提高集系统中硬件资源的利用率，分布式文件系统得到了广泛的应用。Google公司先后提出了BigTable、GPFS以及MapReduce等分布式技术，为处理海量数据提供了宝贵的经验；Hadoop分布式系统框架也应运而生，并在日志分析、商业数据分析等领域得

到广泛应用。目前Hadoop集应用最为成熟的是Yahoo公司，在其生产环境Hadoop集中有超过4000台节点，对其业务运营、客户关系分析等有着重要的现实意义。Hadoop开源项目诞生以来，国内的研究开始较晚，加之国内多数研究机构、厂商等的谨慎保守态度，Hadoop生态系统在云计算领域的应用进展一直比较缓慢。Hadoop技术在国外如火如荼的发展表明，深入研究Hadoop技术的基本原理，实现一个基于Hadoop的云计算平台，有着重要的现实意义。

1 Hadoop基本原理

作为一种开源的分布式云计算技术，Hadoop能够在廉价的服务器上创建集，实现集的横向扩展。Hadoop集主要包括两大核心：HDFS分布式文件系统和MapReduce计算框架。从Yahoo公司的Hadoop平台运行情况可以得知，Hadoop平台有如下优势：1）集中的节点可以是廉价的商用机器，这些大量的机器组成的集能够可靠地处理大规模数据文件；2）多个数据节点上可以并行处理同一个任务，具有高并发性，有效提高了工作处理周期；3）默认情况下，Hadoop集中的数据块会有三个副本，这种备份机制提高了业务数据的冗余性，即使集中的某一服务器发生故障，也不会造成数据丢失的情况。

688IT编程网

Hadoop云计算平台的研究及实现

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Hadoop云计算平台的研究及实现

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式