大数据技术实验报告
大数据技术实验一
Hadoop大数据平台安装实验
1实验目的
在大数据时代,存在很多开源的分布式数据采集、计算、存储技术,本实验将在熟练掌握几种常见Linux命令的基础上搭建Hadoop(HDFS、MapReduce、HBase、Hive)、Spark、Scala、Storm、Kafka、JDK、MySQL、ZooKeeper等的大数据采集、处理分析技术环境。
2实验环境
个人笔记本电脑Win10、
Oracle VM VirtualBox 5.2.44、
CentOS-7-x86_64-Minimal-1511.iso
3实验步骤
首先安装虚拟机管理程序,然后创建三台虚拟服务器,最后在虚拟服务器上搭建以 Hadoop 集为核心的大数据平台。
3.1快速热身,熟悉并操作下列Linux命令
·创建一个初始文件夹,以自己的姓名(英文)命名;进入该文件夹,在这个文件夹下创建一个文件,命名为。
·查看这个文件夹下的文件列表。
·在中写入“Hello Hadoop!”,并保存
·在该文件夹中创建子文件夹”Sub”,随后将文件移动到子文件夹中。
·递归的删除整个初始文件夹。
hadoop分布式集搭建3.2安装虚拟机并做一些准备工作
3.2.1安装虚拟机
下载系统镜像, CentOS-7-x86_64-Minimal-1511.iso。
虚拟机软件使用 Oracle VM VirtualBox 5.2.44。
3.2.2准备工作
关闭防火墙和 Selinux,其次要安装perl 、libaio、ntpdate 和screen。然后检查网卡是否开机自启,之后修改 hosts,检查网络是否正常如图:
然后要创建hadoop用户,之后多次用,并且生成 ssh 密钥并分发。
最后安装 NTP 服务。
3.3安装MYSQL
3.3.1安装
3.3.2测试
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论