一、课程概况
课程名称:Python数据分析、挖掘与可视化      课程编号:
课程性质:限制性选修                        考核方式:考查
建议学时:48+16
spyder python下载前导课程:线性代数、高等数学
适用专业:计算机科学与技术、数据科学、统计、金融、管理等理工科和商科专业
二、教学目的和要求
通过本课程的学习,使得学生能够理解Python的编程模式,熟练运用Python内置函数与运算符、列表、元组、字典、集合等基本数据类型以及相关列表推导式、切片、序列解包等语法来解决实际问题,熟练掌握Python分支结构、循环结构、函数设计以及类的设计与使用,掌握numpy数组运算和矩阵运算、pandas基本数据结构以及数据分析与处理、机器学习基本算法原理以及sklearn实现、matplotlib数据可视化与科学计算可视化。能够根据问题性质和特点选
择合适的机器学习算法,能够根据数据特点选择合适的可视化方式。   
三、教学内容以及重点、难点
第1章  Python开发环境搭建与编码规范
1.1  Python开发环境搭建与使用
教学内容:在Python下载安装包并安装,下载并安装Anaconda3,IDLE、Jupyter Notebook、Spyder简单使用,使用pip和conda命令安装扩展库。
重点、难点:系统环境变量path的设置,安装扩展库。
1.2  Python编码规范
教学内容:缩进对业务逻辑的影响,变量命名规则。
重点、难点:缩进的作用。
1.3  标准库、扩展库对象的导入与使用
教学内容:导入标准库与扩展库对象的几种形式及其区别,导入标准库和扩展库的顺序。
重点、难点:导入标准库与扩展库对象的几种形式及其区别。
第2章  数据类型、运算符与内置函数
2.1  常用内置数据类型
教学内容:整数、实数、复数列表、元组、字典、集合字符串等常用数据类型。
重点、难点:数字大小没有限制,实数计算会有误差,字典的键和集合中的元素不允许重复并且必须为不可变类型的数据,包含一个元素的元组必须有逗号。
2.2  运算符与表达式
教学内容:算术运算符关系运算符成员测试运算符集合运算符逻辑运算符
重点、难点:关系运算符可以连用,关系运算符、成员测试运算符和逻辑运算符具有惰性求值的特点,列表、元组、字符串比较大小时逐个比较其中的元素大小直至得出确定的结论,关系运算符作用于集合时表示集合的包含关系而不关心元素大小。
2.3  常用内置函数
教学内容:类型转换最大值、最小值元素数量、求和排序、逆序基本输入输出range()zip()map()、reduce()、filter()
重点、难点:内置函数max()、min()、sorted()的key参数可以用来指定排序规则,range()函数限定的是左闭右开区间,函数式编程模式。
2.4  综合应用与例题解析
第3章  列表、元组、字典、集合与字符串
3.1  列表与列表推导式
教学内容:创建列表使用下标访问列表中的元素列表常用方法列表推导式切片操作
重点、难点:列表、元组、字符串的下标可以是负数,列表推导式,切片限定的是左闭右开区间。
3.2  元组与生成器表达式
教学内容:元组与列表的区别生成器表达式序列解包
重点、难点:生成器表达式具有惰性求值特点,并且其中的元素只能使用一次,序列解包要求等号两侧值的数量和变量的数量必须相等。
3.3  字典
教学内容:字典元素访问字典元素修改、添加与删除
重点、难点:字典的键可以作为下标,字典的get()方法,使用字典的键作为下标的赋值语句的两种含义。
3.4  集合
教学内容:集合概述集合常用方法
重点、难点:集合常用方法。
3.5  字符串常用方法
教学内容:encode()format()index()、rindex()、count()replace()、maketrans()、translate()ljust()、rjust()、center()split()、rsplit()、join()lower()、upper()、capitalize()、title()、swapcase()startswith()、endswith()strip()、rstrip()、lstrip()
重点、难点:字符串方法返回新的字符串或字节串,不对原字符串进行修改。
3.6  综合应用与例题解析
第4章  选择结构、循环结构、函数定义与使用
4.1  选择结构
教学内容:条件表达式单分支选择结构双分支选择结构嵌套的分支结构
重点、难点:条件表达式与True、False的等价关系,嵌套选择结构的代码缩进。
4.2  循环结构
教学内容:for循环while循环break与continue语句
重点、难点:带else的for循环和while循环执行逻辑以及break语句的作用。
4.3  函数定义与使用
教学内容:函数定义基本语法lambda表达式递归函数生成器函数位置参数、默认值参数、关键参数、可变长度参数变量作用域
重点、难点:lambda表达式功能与适用场合,默认值参数,可变长度参数的两种形式,变量作用域。
4.4  综合应用与例题解析
第5章  文件操作
5.1  文件操作基础
教学内容:内置函数open()文件对象常用方法上下文管理语句with
重点、难点:读写文件时会自动移动文件指针,读写文本文件时一定要注意编码格式。
5.2  JSON文件操作
教学内容:json模块的函数。
重点、难点:separators参数的作用。
5.3  CSV文件操作
教学内容:csv模块的用法。
重点、难点:编码格式的影响,
5.4  Word、Excel、PowerPoint文件操作实战
教学内容:Word、Excel、PowerPoint文件的内容读取。
重点、难点:python-docx、openpyxl、python-pptx扩展库的安装及其用法。
第6章  numpy数组与矩阵运算
6.1  numpy数组及其运算
教学内容:创建数组测试两个数组的对应元素是否足够接近修改数组中的元素值数组与标量的运算数组与数组的运算数组排序数组的内积运算访问数组中的元素数组对函数运算的支持改变数组形状数组布尔运算分段函数数组堆叠与合并
重点、难点:数组与标量的运算,相同形状的数组之间的运算,函数对数组的运算,数组布尔运算,分段函数。
6.2  矩阵生成与常用操作
教学内容:生成矩阵矩阵转置查看矩阵特征矩阵乘法计算相关系数矩阵计算方差、协方差、标准差
重点、难点:矩阵与数组的区别。
6.3  计算特征值与特征向量
教学内容:矩阵特征值与特征向量的含义,eig()函数。
重点、难点:矩阵特征值与特征向量的含义。
6.4  计算逆矩阵
教学内容:逆矩阵的计算,inv()函数。
重点、难点:不是所有矩阵都有逆矩阵。
6.5  求解线性方程组
教学内容:solve()函数。
6.6  计算向量和矩阵的范数
教学内容:范数的定义与含义,form()函数。
重点、难点:向量范数与矩阵范数的区别。
6.7  奇异值分解
教学内容:奇异值的定义,奇异值分解,svd()函数。
重点、难点:奇异值的定义,奇异值分解的意义。
6.8  函数向量化
教学内容:普通函数向量化。
第7章  pandas数据分析实战
7.1  pandas常用数据类型
教学内容:一维数组与常用操作时间序列与常用操作二维数组DataFrame
重点、难点:时间序列与常用操作。
7.2  DataFrame数据处理与分析实战
教学内容:读取Excel文件中的数据筛选符合特定条件的数据查看数据特征和统计信息按不同标准对数据排序使用分组与聚合对员工业绩进行汇总处理超市交易数据中的异常值处理超市交易数据中的缺失值处理超市交易数据中的重复值使用数据差分查看
员工业绩波动情况使用透视表与交叉表查看业绩汇总数据使用重采样技术按时间段查看员工业绩多索引相关技术与操作使用标准差与协方差分析员工业绩使用pandas的属性接口实现高级功能绘制各员工在不同柜台业绩平均值的柱状图查看DataFrame的内存占用情况数据拆分与合并
重点、难点:sort_index()、sort_values()、groupby()、fillna()、diff()、pivot()、crosstab()、resample()等函数或方法的用法,聚合函数的作用,属性接口。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。