《数据清洗》课程教案
学院: 计算机系/学院
课程/正则匹配哈希值项目名称
数据清洗
课程
总学时:72学时
理论:36学时
  实验:36学时
学分
3
课程
课程类别:专业必修 专业必修 公共必修 公共选修
授课教师
***
授课专业
大数据技术与应用
授课班级
教学
目的和要求
本课程的主要目的培养学生的数据清洗的理论分析与应用实践的综合能力。通过本课程的教学,使学生掌握数据清洗的一般方法和实现技术,能使用编程或者开源软件解决数据清洗相关的问题
教学
重点、难点
教学重点:
认识数据清洗
文件格式
Web数据抽取
网络爬虫
Kettle数据清洗
数据迁移
文本数据处理
Python数据清洗
DataCleaner数据清洗与分析
教学难点:
掌握数据清洗基本过程、处理步骤和方法;
掌握 Web数据抽取与网络爬虫;
熟练 Kettle数据清洗方法
掌握数据Python数据清洗
教学
资源
多媒体课件
习题答案
微课视频
试题库
其他教学资源:
《数据清洗》黄源主编,清华大学出版社
教学
环境
多媒体教学,课堂教学与学生上机实践相结合
案例实现
《数据清洗》课程教案
                                        第 1 次课  2 学时
授课内容
数据清洗概论1
教学目的
与要求
通过本课的学习,学生应该掌握如下知识:
1)数据清洗的概念
2)数据清洗的对象
3)数据清洗的原理
4)数据清洗的方法
重点
难点
1)数据清洗的方法
教学进程
安排
教学导入:
介绍数据清洗与的重要性,举例说明数据清洗典型案例,逐步引入到课程的介绍内容中来。
引入课程思政,说明在使用数据时应当在法律范围内。
授课内容:
一、《数据清洗与》课程介绍
介绍本门课程的学科地位、考核方式、学习内容安排、可以参考的学习资料。
二、讲授数据清洗的定义、原理与发展
1)讲授数据清洗的含义和内容
2)讲授数据清洗的对象
3)讲授数据清洗的原理
4)讲授数据清洗主要的方法
课后学习
任务布置
查阅数据清洗用途的相关资料与案例
主要
参考资料
《数据清洗》黄源主编,清华大学出版社

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。