Windows平台上安装Hadoop-0.20.203.0版本方法 目的
这篇文档的目的旨在说明在Windows平台上、利用Cygwin模拟Linux环境下,完成单机上Hadoop-0.20.203.0版的安装与使用。同时也旨在解决你在安装hadoop过程中出现JA V A_HOME is not set或是bin/java No such file or directory错误的问题。
先决条件
1支持平台。
Win32平台是作为开发平台支持的。由于分布式操作尚未在Win32平台上充分测试,所以还不作为一个生产平台被支持。
2所需软件
2.1Java TM1.6.x,必须安装且版本要为1.6及以上,建议选择Sun公司发行的Java版本。
2.2Cygwin,提供Shell支持。本文使用最新版1.7.x,要选择安装Openssh、Openssl等。
2.3Hadoop-0.20.20
3.0 最新的稳定版。
安装支持软件
1安装Java
安装下载的Java 1.6.x,使用安装,安装路径比如为:C:\Java\jdk1.6.0_27。安装完成后,配置环境变量如下:
设置JA V A_HOME变量值为:C:\Java\jdk1.6.0_27
设置CLASSPATH 变量值为:
.;%JA V A_HOME%\lib\dt.jar;%JA V A_HOME%\lib\tools.jar
向path变量中添加路径,添加%JA V A_HOME%\bin;%JA V A_HOME%\jre\bin
2安装Cygwin
安装Cygwin,可以从上下载最新的cygwin1.7.9-1进行安装。本人把下载的 放在C:\Cygwin-localPackage文件夹中,该文件用于存储安装选项网络下载的源文件,双击
<进行安装。安装流程如下:
图1 图2
注:图2 中选择install from internet
图3 图4
注:图3确定安装路径如C:\cygwin;图4选择下载文件存放的路径如C:\Cygwin-localPackage
图5 图6
图6 选择下载安装文件的站点,本文选择默认的第一个站点。
图7 图8
图7  选择你要安装的软件,基本功能已经默认选择,但请添加Net 类中的Openssh和Openssl,如上图8。如果你想使用cygwin中gcc/g++,gfortran之类的编译器及其他工具,可以选择安装。
选择好要安装的包后,直接下一步下一步可完成安装Cygwin环境。
3配置Cygwin
将cygwin安装路径添加到windows的path变量中,其中将C:\cygwin\bin; C:\cygwin\usr\sbin; C:\cygwin\usr\i686-pc-cygwin\bin添加到path变量中。
另外,在Cygwin中不到某个工具时可添加安装,直接双击之前的即可。
4无密码ssh配置
4.1 安装ssh 服务
进入Cygwin中,输入ssh命令后回车,确认是否安装了ssh。然后输入命令:ssh-host-config 回车,第一次询问时回答no,然后yes下去,直到要求输入The value of CYGWIN for daemon,此时输入ntsec。
到此打开系统服务,在windows系统服务中会看到Cygwin sshd服务,启动服务。退出cygwin。具体操作如下图:
图9 图 10
图11 图12
图 13
4.2 无密码ssh配置
windows开发平台
再次登录cygwin,输入命令:ssh-keygen回车,一直yes,会在cygwin环境的个人用户目录下生成.ss件夹,里面包含口令文件。使用命令:cd .ssh回车,切换到.ssh目录,使用ls 命令可以看到当前目录下的文件。再使用命令:cat id_rsa.pub >> authorized_keys回车即可完成无密码ssh的配置。
4.3 无密码ssh登录
再次使用命令ssh localhost 回车,可以不用密码登录ssh了。
下载和配置Hadoop
1下载Hadoop软件
到hadoop上下载hadoop-0.20.203.0版本,当然也可以到这个网址下载/dist/hadoop/core/,将下载的文件解压,本文将解压包放到了C:\cygwin\home\Administrator\hadoop目录下,这个目录也是hadoop的主目录。
2配置Hadoop运行的文件
这一步也是最关键的一步,哥在这里花了相当的时间,这一点问题的解决也是我撰写本文的主要目的。
2.1编辑conf/hadoop-env.s件
编辑 hadoop目录下的conf/hadoop-env.s件,至少需要将JA V A_HOME设置为Java安装根路径。先将原来的# export JA V A_HOME=/usr/lib/j2sdk1.5-sun行的#符号去掉,#为注释符,然后将JA V A_HOME改为你的jdk安装的路径。这里关键的一点是在cygwin环境下windows 的c:路径已经被映射为/cygdrive,所以JA V A_HOME的路径就为/cygdrive/c/Java/jdk1.6.0_27 具体该行修改为:export JA V A_HOME=/cygdrive/c/Java/jdk1.6.0_27
2.2 添加HADOOP_HOME变量值到PATH中
另外本文还做了如下修改在# Command specific options appended to HADOOP_OPTS when specified 行的后面添加了hadoop的主工作目录,并将该目录添加到了Cygwin的path变量中。
添加的两行为:
export HADOOP_HOME=/cygdrive/c/cygwin/home/Administrator/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
具体的hadoop 主目录与你的放置hadoop软件位置所决定。
2.3 配置l、l和l 文件
2.3.1 向l文件中添加内容后如下:
<configuration>
<property>
<name&p.dir</name>
<value>d:\tmp</value> //没有这个目录要自己创建
<description>
A base for other temoporary directoies.
</description>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
<description>
The name of the default file system.A url whose
scheme and authority determine the FileSystem implementation.  The

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。