Red Hat linux 9.0 下Hadoop单机配置--688IT编程网

Red Hat linux 9.0 下Hadoop单机配置

詹坤林

1 hadoop获取 (1)

2 hadoop安装前提 (1)

3 详细安装过程 (2)

1 hadoop获取

下载：apache.freelamp/hadoop/

Core是hadoop，Hbase，Hive等都是子项目。

2 hadoop安装前提

Hadoop的安装与运行需要依赖以下程序，在安装Hadoop之前，请确保在计算机上已经安装了以下软件：

(1)Java™1.5.x及以上版本，推荐Sun公司的官方版本(www.java)，必须安装。

下载时请注意选择对应于机器配置的正确的版本（操作系统、32/64位）；

(2) ssh(安全外壳协议)，必须安装，且每次系统启动时sshd服务也必须自动启动。

①Ubuntu用户可以用以下命令自动下载并安装：

$ sudo apt-get install ssh

$ sudo apt-get install rsync

②red hat linux 9

(i)默认已经安装ssh服务，以下命令查看版本

[root@linux-zkl root]# rpm -q openssh-server

openssh-server-3.5p1-6

(ii)设置ssh为开机自启动

使用ntsysv命令，在弹出窗口中选择sshd服务，在前面加上*号(定位到[]，然后按以下空格键即可加上*号)，然后按Tab键，到确定按钮，回车确定。

(iii)启动ssh

[root@linux-zkl root]# /etc/init.d/sshd start

启动 sshd [ 确定 ]

[root@linux-zkl root]# /etc/init.d/sshd stop

停止 sshd： [ 确定 ]

③其他Linux版本的用户可以到www.openssh/portable.html下载openssh并按照相关说明安装；

(3) 如果运行在Windows平台上，则必须安装Cygwin（从win/下载），安装好Cygwin之后还需要安装openssh包。

需要注意的是，由于Hadoop需要通过ssh服务在各个节点之间登录并运行服务，因此必须确保安装Hadoop的各个节点之间的网络畅通，网络畅通的标准是每台机器的主机名和IP地址能够被所有机器正确解析（包括它自己）.

3 详细安装过程

(0)软件必备：安装jdk1.5以上(我的jdk安装在/usr/java/jdk1.6.0_13下面)。

(1)下载 hadoop-0.20.，拷贝到linux某文件夹，例如/usr/hadoop(自己建的一个文件夹hadoop)，然后解压文件，得到 /usr/hadoop/hadoop-0.20.1

(2)修改 conf/hadoop-env.sh 文件

[root@linux-zkl root]# vi /usr/hadoop/hadoop-0.20.1/conf/hadoop-env.sh

# Set Hadoop-specific environment variables here.

# The only required environment variable is JAVA_HOME. All others are

# optional. When running a distributed configuration it is best to

# set JAVA_HOME in this file, so that it is correctly defined on

# remote nodes.

# The java implementation to use. Required.

# export JAVA_HOME=/usr/lib/j2sdk1.5-sun

export JAVA_HOME=/usr/java/jdk1.6.0_13

<；因为我的jdk安装在/usr/java/jdk1.6.0_13下面>

在其中设置 JAVA_HOME 环境变量：

export JAVA_HOME="C:\Program Files\Java\jdk1.5.0_01” (这里因为路径中 Program Files 中间有空格，一定要用双引号将路径引起来)

(3)配置完毕了

(4)测试例子:

在Hadoop中，带有几个示例程序并且已经打包成了hadoop-0.20.1-examples.jar。其中有一个WordCount 程序，功能是统计一批文本文件中各个单词出现的次数，我们先来看看怎么运行这个程序。

$ cd /usr/hadoop/hadoop-0.20.1

$ mkdir test-in

$ cd test-in

$ echo "hello world bye world" &

linux安装jdk环境变量

$ echo "hello hadoop goodbye hadoop" &

#在 test-in 目录下创建两个文本文件, WordCount 程序将统计其中各个单词出现次数

$ cd ..

$ bin/hadoop jar hadoop-0.20.1-examples.jar wordcount test-in

test-out

注意事项：运行 bin/hadoop jar hadoop-0.16.0-examples.jar wordcount test-in test-out 时，务必注意第一个参数是 jar, 不是 –jar。

注意文件分别是,，test-out目录是程序生成的，运行前必须先删除test-out目录

#执行完毕，下面查看执行结果：

$ cd test-out

$ cat part-00000

bye 1

goodbye 1

hadoop 2

hello 2

world 2

688IT编程网

Red Hat linux 9.0 下Hadoop单机配置

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

Red Hat linux 9.0 下Hadoop单机配置

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法