《大数据存储技术》教学大纲
一、课程基本信息
课程编号:618041675
中文名称:大数据存储技术
英文名称:Storage technology for big data
课程类别:专业方向选修课
适用专业:智能科学与技术。
开课学期:春
总学时:48 总学分:2.5
周时:4 实验学时:16
先修课程(编号):程序设计基础(618000221),数据结构I(618040222),数据库原理及应用(618040524),Java新技术(618042776),Linux技术(618041365),Python(618041574)。
课程简介:本课程智能科学与技术专业的专业方向选修课。课程围绕HDFS分布式文件系统、HBase 分布式数据库、Hive数据仓库、NoSQL数据库等几个方面来介绍大数据存储技术,通过课堂讲授、课程实验相结合的方式,使学生系统地理解大数据存储技术的基本原理及实现技术,为全面培养对大数据领域的存储技术的认知、设计与创新能力奠定良好的基础。
建议教材:
林子雨主编.《大数据技术原理与应用》.北京:人民邮电出版社,2018
参考教材:
李俊杰主编. 《大数据技术与应用基础项目教程》.北京:人民邮电出版社,2017
二、课程教育目标
课程主要介绍分布式文件系统HDFS的重要概念、体系结构、存储原理和读写过程、分布式数据库HBase 的访问接口、数据模型、实现原理和运行机制、NoSQL数据库的三大基石、Hive数据仓库功能、体系结构等内容。通过理论讲授与实践环节相结合,培养学生大数据领域的存储技术的认知、应用能力。
三、理论教学内容与要求
共32学时。
1.分布式系统概述(2学时)
主要内容:
分布式系统的架构及原理。
基本要求:
了解分布式系统一般适用场景、基本架构及原理。
2.HDFS分布式文件系统(8学时)
主要内容:
HDFS的适用场景、优缺点、基本架构及原理,HDFS Shell命令、Java API等。
基本要求:
掌握HDFS分布式文件系统、HDFS Shell命令、Java API。
hbase工作原理
3.HBase分布式数据库(10学时)
主要内容:
介绍HBase数据模型、物理存储、架构、Write-Ahead-Log、HBase存储格式、应用、配置管理、HBase Java API使用等。
基本要求:
掌握HBase分布式数据库架构、HBase存储格式、应用、配置管理、HBase Java API。
4.Hive数据仓库(8学时)
主要内容:
介绍Hive功能、体系结构、使用场景、Hive环境搭建、Hive常见查询、Hive中的内部表、外部表、分区表等。
基本要求:
掌握体系结构、Hive环境搭建、Hive常见查询、Hive中的内部表、外部表、分区表等。
5.NoSQL数据库(4学时)
主要内容:
介绍NoSQL与关系数据库的比较、NoSQL的四大类型、NoSQL的三大基石等。
基本要求:
了解NoSQL的四大类型、NoSQL的三大基石。
四、作业
小论文:比较关系型数据库与NoSQL。
五、考核方式
最终成绩由平时成绩、实验成绩和作业等组合而成。
六、成绩评定
1.考核与评价方式及成绩评定
最终成绩由平时成绩、实验成绩和作业/测验等组合而成,各部分所占比例如下:
平时成绩:20%。主要考核对每堂课知识点的复习、理解和掌握程度。主要形式是作业、课堂考勤、提问等情况。
实验成绩:30%。主要考核HBase编程、Hive编程等内容,学生可根据任课教师提出的实验题目与目标,结合理论原理与实际问题,进行实验设计、给出实验流程、结果及分析说明。主要形式是实验报告与答辩。
作业/测验成绩:50%。主要考核对大数据存储基础知识的掌握程度,考核方式为小论文。
(执笔人:闫肃)
大数据存储技术实验教学大纲
一、适用范围
适用于智能科学与技术专业本科教学使用。
二、课程名称
大数据处理
三、学时数与学分
总学时:48 总学分:2.5
实验学时:16
四、教学目的和基本要求
本实验课程包括大数据存储技术课程要求完成的必做实验。通过实验教学,使学生了解Hbase分布式数据库的特点和系统框架、HIVE的架构和组件,掌握Shell命令、API编程及MapReduce与HBase集成、掌握对表的各种操作方法。
本实验课程强调理论到实践的转化和实际动手能力的培养,通过实验教学,让学生具有大数据存储技术的实践学习经历,锻炼学生分析问题及将本专业基础理论知识应用于解决实际问题的能力。
基本要求:
1、教师在实验前必须布置好相关实验内容。
2、每次实验前,应做好预习和复习,掌握相关的理论知识。
3、根据实验内容设计好实验程序。
4、实验中仔细分析所遇到的问题,争取独立解决。
5、认真做好实验记录。
6、实验结束后,及时整理实验报告。实验报告项目填写应齐全,字迹应工整。
六、所需设备材料
根据课程进度以班级为单位统一安排实验,实验时每名同学一组,在大数据实验室完成实验。
七、教材、讲义及参考书
林子雨主编.《大数据技术原理与应用》.北京:人民邮电出版社,2018
李俊杰主编,《大数据技术与应用基础项目教程》.北京:人民邮电出版社,2017
八、实验成绩评定办法
实验成绩=考勤(25%)+验收(60%)+报告(15%)
大纲编写人:闫肃

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。