Hadoop 完全分布式集搭建详细图⽂教程本⽂所使⽤的环境及版本:
CentOS Linux release 7.9.2009 (Core)
jdk1.8.0_291hadoop-3.2.2
⼀、安装模板机
1、安装CentOS 7.9并配置⽹络
注意:在安装虚拟机时建议分配50G以上的磁盘容量,避免后期磁盘不够⽤需⼿动扩容的⿇烦关于CentOS 7.X 的安装参照这篇⽂章:
2、安装 epel-release
注:Extra Packages for Enterprise Linux 是为“红帽系”的操作系统提供额外的软件包,适⽤于 RHEL、CentOS 和 Scientific Linux。(相当于是⼀个软件仓库,⼤多数 rpm 包在官⽅ repository 中是不到的)
3、由于本教程安装的是最⼩系统,所以还需要安装⼀些⼯具包
3.1、net-tool :⼯具包集合,包含 ifconfig 等命令
3.2、vim :编辑器
[root@hadoop100 ~]# yum install -y epel-release 1[root@hadoop100 ~]# yum install -y net-tools
1
4、关闭防⽕墙
5、创建⼀个普通⽤户[root@hadoop100 ~]# yum install -y vim
1[root@hadoop100 ~]# systemctl stop firewalld [root@hadoop100 ~]# systemctl disable firewalld.ser
vice
1
2
注意: 若在安装时已经创建过普通⽤户,可以直接使⽤之前创建过的普通⽤户,也可以根据此步骤再创建⼀个普通⽤户,⽤户名为sumu,密码为123456(⽤户名和密码⾃定义)
6、配置 sumu ⽤户具有 root 权限,⽅便后期加 sudo 执⾏执⾏ root 权限的命令注意:在 %wheel ALL=(ALL) ALL  这⼀⾏的下⾯添加 sumu ALL=(ALL) NOPASSWD:ALL (此处的sumu为要赋予权限的⽤户)
sumu 这⼀⾏不要直接放到 root ⾏下⾯,因为所有⽤户都属于 wheel 组,你先配置了 sumu 具有免密功能,但是程序执⾏到%wheel
⾏时,该功能⼜被覆盖回需要密码。所以 sumu 要放到%wheel 这⾏下⾯。7、在/opt ⽬录下创建⽂件夹,并修改所属主和所属组
1)在/opt ⽬录下创建 module 和 software ⽂件夹(software ⽤于存放软件安装包,⽽ module ⽤于存放解压后的⽂件包)
2)修改 module、software ⽂件夹的所属主和所属组均为 sumu ⽤户[root@hadoop100 ~]# useradd sumu [root@hadoop100 ~]# passwd 123456
1
2[root@hadoop100 ~]# vim /etc/sudoers
1[root@hadoop100 ~]# mkdir /opt/module [root@hadoop100 ~]# mkdir /opt/software
1
2[root@hadoop100 ~]# chown sumu:sumu /opt/module [root@hadoop100 ~]# chown sumu:sumu /opt/software
1
2
3)查看 module、software ⽂件夹的所有者和所属组
8、安装 rsync
(后⾯⽤于执⾏集分发脚本)
启动 rsync 并设置开机⾃启
检查是否启动成功[root@hadoop100 opt ]# yum install -y rsync
1[root@hadoop100 opt ]# systemctl start rsyncd.service [root@hadoop100 opt ]# systemctl enable rsyncd.service
1
2[root@hadoop100 opt ]# netstat -lnp|grep 873
1
修改f 配置⽂件,保存退出
重启rsync
9、卸载CentOS ⾃带的JDK
注意:本教程使⽤的是最⼩系统默认没有JDK,所以不⽤执⾏此命令
10、重启虚拟机
⼆、克隆虚拟机
利⽤上⾯的模板机,克隆三台虚拟机:node101、node102、node103。(注意:克隆时需要先关闭模板机)
1、克隆步骤如下:
1.1、先关闭模板机,然后⿏标右键点击 模板机,接着点击管理,再点击克隆[root@hadoop100 opt ]# vim /f
1# 运⾏RSYNC 守护进程的⽤户uid = root # 运⾏RSYNC 守护进程的组gid = root #不使⽤chroot use chroot  = no # 最⼤连接数为4max connections = 4# CentOS7中yum 安装不需指定pid file 否则报错#
pid file = /var/run/rsyncd.pid # 指定锁⽂件lock file =/var/run/rsyncd.lock # 指定⽇志⽂件log file  = /var/log/rsyncd.log exclude = lost+found/transfer logging = yes # 超时时间timeout  = 900# 同步时跳过没有权限的⽬录ignore nonreadable = yes # 传输时不压缩的⽂件dont compress = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2
1
2
java安装完整教程3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22[root@hadoop100 opt ]# systemctl restart rsyncd.service
1[root@hadoop100 opt ]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps
1[root@hadoop100 ~]# reboot
1

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。