第2章源数据获取
教案
课程名称:ETL数据整合和处理
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论30学时,实验34学时)
总学分:4.0学分
本章学时:8学时
一、材料清单
(1)《ETL数据整合和处理(Kettle)》教材。
(2)引导性提问。
(3)探究性问题。
(4)拓展性问题。
二、教学目标与基本要求
1.教学目标
在Kettle软件上,讲授Kettle与MySQL数据库之间的连接。讲授从数据库、Excel和CSV文件等源数据中获取数据的方法和操作,以及通过生成记录、生成随机数和获取系统信息等源数据生成的方法和操作。让学生达到以下教学目标:
(1)掌握数据库连接的创建方法和参数设置。
(2)熟悉抽取源数据和生成数据的常用方法。
(3)掌握常用抽取源数据和生成数据组件及其参数设置。
(4)熟悉组件处理后的结果数据解读。
trunc函数如何取整2.基本要求
(1)掌握Kettle与MySQL数据库之间的连接。
(2)熟练建立转换工程和创建相关的转换组件。
(3)掌握获取源数据的常用组件和参数设置。
(4)掌握生成数据的常用组件和参数设置。
(5)熟练浏览组件执行结果和掌握出错处理方法。
三、问题
1.引导性提问
引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。
(1)Kettle通过什么方法与数据库建立连接?
(2)Kettle是怎样获取数据的?
(3)Kettle能够生成数据吗?
(4)Kettle可以获取哪些典型类型文件的数据?
(5)获取源数据需要编程吗?
2.探究性问题
探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。
(1)获取源数据的处理过程是怎么样的?
(2)组件是什么?
(3)组件参数有什么用?
(4)获取数据库数据与文件数据的方法是否一样?
(5)获取数据和生成数据的应用场景有何异同?
(6)通过什么方法可以浏览获取的源数据?
3.拓展性问题
拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完成拓展性的问题。
(1)组件的参数的作用是什么?
(2)CSV和Excel文件都能用Excel查看文件数据,为何需要使用CSV文件、Excel 输入两个不同的组件来获取其数据?
四、主要知识点、重点与难点
1.主要知识点
(1)数据库连接,以及共享/停止数据库连接。
(2)表输入、CSV文件、Excel输入等组件的参数设置和使用。
(3)生成记录、生成随机数、获取系统信息等组件的参数设置和使用。
2.重点
(1)数据库连接以及共享连接的应用场景。
(2)表输入、CSV文件、Excel输入等获取源数据组件的应用场景和操作。
(3)生成记录、生成随机数、获取系统信息等生成数据组件的应用场景和操作。
3.难点
表输入、CSV文件、Excel输入等组件的参数设置和不同之处。
生成记录、生成随机数、获取系统信息等组件的参数设置和不同之处。
五、教学过程设计
1.理论教学过程
(1)创建数据库连接。
(2)共享/停止共享数据库连接。
(3)表输入组件及其参数设置。
(4)CSV文件组件及其参数设置。
(5)Excel输入组件及其参数设置。
(6)生成记录组件及其参数设置。
(7)生成随机数组件及其参数设置。
(8)获取系统信息组件及其参数设置。
2.实验教学过程
(1)在Kettle软件上,与MySQL建立数据库连接。
(2)进行共享/停止共享数据库连接
(3)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。
(4)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。
(5)建立转换工程和Excel输入组件,设置组件参数,运行和预览数据。
(6)建立转换工程和生成记录组件,设置组件参数,运行和预览数据。
(7)建立转换工程生成随机数组件,设置组件参数,运行和预览数据。
(8)建立转换工程和获取系统信息组件,设置组件参数,运行和预览数据。
六、教材与参考资料
1.教材
2.参考资料

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。