《数据挖掘与机器学习》教学大纲
01课程性质
本课程以数据挖掘和机器学习为主要内容,讲述实现数据挖掘的主要功能、数据挖掘、机器学习算法和应用,并通过对实际数据的分析更加深入地理解常用的数据挖掘与机器学习模型。培养分析和处理的能力。该课程的先修课程有概率论与数理统计、数据库原理和程序设计等。
02教学目的
本课程的主要目的是培养学生的数据挖掘与机器学习的理论分析与应用实践的综合能力。通过本课程的教学,使学生掌握数据挖掘和机器学习的一般原理和处理方法,能使用机器学习理论解决数据挖掘相关的问题。
03教学内容
本课程全面而又系统地介绍了数据挖掘与机器学习的方法和技术,反映了当前数据挖掘和机器
学习研究的最新成果。本课程主要学习的内容包括Python数据分析与可视化基础、认识数据、数据预处理、回归分析、关联规则挖掘、分类与预测、聚类分析、神经网络与机器学习基础、离点检测以及Python数据挖掘案例分析等内容。
04教学时数
本课程的教学时数为72学时,理论教学54学时,实验教学18学时。
第一章 数据挖掘概述
教学要点:
1.理解和掌握数据挖掘与机器学习的基本概念、数据挖掘过程、数据挖掘的主要任务以及数据挖掘使用的主要技术。
2.了解数据挖掘与机器学习的应用和面临的问题。
3.对数据挖掘和机器学习能够解决的问题和解决问题思路有清晰的认识。
4.熟练应用Jupyter notebook的开发环境。
教学时数:4学时。
考核要点:了解数据挖掘的定义和功能,理解数据挖掘在何种数据上进行, 数据挖掘可以挖掘什么类型的模式,掌握初级的数据分析方法。
第二章 Python数据分析与挖掘基础
教学要点:
1.理解和掌握Python基础语法、内建的数据结构、Numpy数值运算基础、Pandas统计分析基础。
2.掌握Matplotlib图表绘制基础等数据分析和可视化方法。
教学时数:6学时。
考核要点:掌握Python编程基础,数据分析与可视化方法。
第三章认识数据
教学要点:
1.理解和掌握数据对象和属性类型,数据的基本统计描述,掌握度量数据相似性和相异性的方法。
2.了解数据可视化的方法。
教学时数:3学时。
考核要点:了解数据的属性类型,理解数据的基本统计描述, 掌握度量数据相似性和相异性的方法。
第四章 数据预处理
教学要点:
1.了解数据预处理的目的和意义。
2.掌握如何对数据进行清理。
3.掌握如何对不同数据源的数据进行合并。
4.掌握如何对数据进行变换,使之适合建模的需要。
5.掌握如何对数据进行消减,使得在消减后的数据集上挖掘更有效。
numpy是什么数据类型6.掌握利用Python进行数据预处理的方法。
教学时数:4学时。
考核要点:理解数据清理、数据集成、数据规约、数据变换于数据离散化的方法, 掌握数据预处理的基本方法。
第五章 回归分析
教学要点:
1.掌握回归分析原理。
2.掌握一元线性回归分析。
3.掌握多元线性回归分析。
4.掌握逻辑回归。
5.了解其他回归分析。
教学时数:4学时。
考核要点:掌握回归的定义的定义,各类回归的原理及Python实现。
第六章 关联规则挖掘
教学要点:
1.了解关联规则的基本思想、概念和意义。
2.了解关联规则挖掘的应用背景;掌握常用的关联规则算法。
3.掌握利用Python实现关联规则分析。
4.了解其它方法的内容、了解关联规则挖掘的研究动态。
教学时数:4学时。
考核要点:了解频繁项集、闭项集和关联规则的概念,理解模式评估方法, 掌握Apriori算法和挖掘频繁项集的模式增长方法。
第七章 分类
教学要点:
1.了解分类及预测的基本思想、概念和意义。
2.掌握常用的分类及预测算法(或模型)。
3.了解分类及预测挖掘的研究动态。
4. 掌握利用Python实现各种分类算法的方法。
教学时数:12学时。
考核要点:了解分类的概念,理解评估分类器性能的度量方法, 掌握决策树分类算法、SVM、贝叶斯分类算法、模型评估与选择、组合分类及利用Python实现分类的方法。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论