大数据实训教学大纲
一、实训目标
基于Hadoop为核心,通过实训,达成以下目的:
认识大数据,认识大数据技术在新时代对企业的重要性。
掌握 Linux的基础知识和应用
掌握hadoop集环境的搭建。
熟悉HDFS分布式文件系统的原理,掌握HDFS的API的开发。
通过实际案例的开发,了解MapReduce原理,掌握MapReduce的开发技术。
了解Hive,学习Hive集的搭建。掌握Hive的DML和DDL相关技术。
认识ZooKeeper,学些ZooKeeper集的搭建,了解ZooKeeper在Hadoop集中的作用。
了解HBase原理和架构,掌握HBase API编程,掌握HBase数据的导入和导出。
通过综合案例实践,掌握Hadoop以及相关框架的开发和应用。
二、实训课程内容介绍
1、课程大纲
项目实战 | 技能培训 | ||
项目阶段 | 任务分解说明 | 任务 | 说明 |
项目启动 | 实习总动员 | 项目管理培训 | 1、学生分组 2、通过案例初步认识大数据 |
技术速成 | Linux入门 | 技术培训 | 1、Linux简介、安装 2、常用命令 3、文件权限及操作 4、用户及权限管理 5、Linux下搭建Java开发环境 |
Hadoop入门 | 1、Hadoop介绍 2、Hadoop安装配置 3、hadoop初始化和测试 4、配置ssh免密码登陆配置和ssh原理 | ||
HDFS | 1、HDFS原理 2、HDFS的shell操作 3、HDFS原理 4、HDFS的java接口 5、Hadoop RPC 6、HDFS读取数据过程 | ||
Map-Reduce | 1、MR介绍 2、WordCount执行流程和代码编写 3、MR排序 4、Combiner编程 5、shuffle过程 | ||
Hive | 1、Hive入门安装 2、DDL数据定义语言 3、DML数据操作语言 4、Hive安装mysql metastore 5、Hive分区表 6、Hive的UDF 7、倒排索引 | ||
ZooKeeper | 1、ZooKeeper介绍 2、ZooKeeper客户端使用 3、hadoop集搭建 4、Hadoop集测试 | ||
Hbase | 1、HBase入门 2、HBaseJava编程 3、Hbase架构讲解 4、MR on Hbase 5、Hive on Hbase 6、Hbase集管理 7、Hbase数据导入 8、Hbase备份与恢复 | ||
项目验收准备 | 1、制定验收规则 2、如何制作PPT 3、如何演说 | ||
发布总结 | 项目验收 | 项目验收、关闭 经验总结 | 1、 项目验收与评分 2、 项目关闭:总结项目经验与教训 3hadoop分布式集搭建、 职业规划 |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论