信19与电10
China Computer&Communication信息化徽有2020年第22期
Excel和Python对比学习在Python数据分析课程
中的运用
沈涵飞
(苏州工业园区月艮务外包职业学院,江苏苏州215123)
html模板文件if摘要:随着大数据时代的来临,数据分析在工作中越来越重要.Python是数据科学的主流开发语言,与Excel相比,具有独特的优势.但先学Python程序设计再学Python数据分析的学习路径,对非计算机相关专业的学生来说,存在很大的困难。本文提出了在课程中运用Excel和Python对比学习的教学方式,有助于降低课程的门槛,突出学习重点,在实践中获得了很好的教学效果。
关键词:对比学习;数据分析教学;速查表;任务驱动
中图分类号:TP311.13-4;G642文献标识码:A文章编号:1003-9767(2020)22-249-03
Application of Excel and Python Comparative Learning in Python Data
Analysis Course
c语言sizeof与strlen函数的区别SHEN Hanfei
最小的中文linux(Suzhou Industrial Park Institute of Services Outsourcing,Suzhou Jiangsu215123,China) Abstract:With the advent of the era of big data,data analysis is becoming more and more important in our work.Python is the mainstream development language of data science.Compared with Excel,Python has unique advantages.However,it is very difficult for non-computer related majors to learn Python programming first and then Python data analysis.This paper puts forward that using Excel and Python to teach in the course can help lower the threshold of the course,highlight the key points of learning,and achieve good teaching results in practice.
Keywords:comparative study;teaching of data analysis;CheatSheet;task-driven
0引言的语法和高层次的语言表示表达了应用计算机解决问题的计
2018年3月15日,教育部办公厅发布《教育部办公厅关于公布首批“新工科”研究与实践项目的通知》旳。新工科专业主要指针对新兴产业的专业,以互联网和工业智能为核心,包括大数据、云计算、人
工智能、区块链、虚拟现实、智能科学与技术等相关工科专业。在此背景下,信息工程学院开设了《Python数据分析》课程作为公共选修课。
1开设《Python数据分析》课程的目的
Excel是最常用的数据分析工具,具有上手容易、学习资源丰富、图表定制功能强大等特点。Python是数据科学的主流开发语言,设计理念是关心计算问题的求解,其轻量级算思维理念何。Python语言抽象了问题及解决方案,自动化问题求解,是“复杂信息系统时代”利用计算机解决问题最直观的表达工具[3]o使用Python处理数据相对于Excel的优势有以下几方面。①Python有更多的数据获取途径。例如,使用Pandas中的read_html函数直接抓取网页上的表格,使用Requests和BeautifulSoup库从网站抓取数据并解析数据,TuShare库则能为金融分析人员提供快速、整洁和多样的易于分析的证券数据,极大地减轻数据获取的工作量。②Python 在处理大量数据时的效率高于Excel,特别是对海量数据的处理效果要明显优于Excel。③Python是脚本语言,容易实现自动化操作。Excel的VBA是基于Excel内部的自动化,
基金项目:校本教材《Python程序设计与数据处理实例教程》(项目编号:19jc05)»
作者简介:沈涵飞(1978-),男,江苏苏州人,硕士研究生,系统架构设计师,讲师。研究方向:信息化教学、专利分析等。
信
ia 与电
ns China Computer & Communication 信息化嶽育2020年第22期
其他方面的自动化就做不了,比如批量修改文件名,而使用 Python 很容易实现。④Python 可用来做算法模型。广义的 数据分析包含了算法,比如各类机器学习和数据挖掘算法。 使用者只需要理解基本的算法原理和应用条件,Python 就能 定制算法模型解决任务,比如使用kNN 、决策树等对数据进 行分类操作。由于Python 具有这些优势,因此开设了《Python 数据 分析》课程作为公共选修课。《Python 数据分析》课程不能 简单地认为是《Python 程序设计》+《数据分析》。程序设
计类课程的基本目标是培养学生的计算思维能力,其教学模 式是由逻辑驱动的,一般从变量、数据类型、运算符与表达 式开始,然后是分支判断和循环结构,以及函数、文件操作等。 作为公共选修课的《Python 数据分析》重在培养学生的数据 处理和分析能力,因此选用的教材和课程教学的模式都应该 是任务驱动而不是逻辑驱动。在通常的课程设置中,往往是先开设《Python 程序设计》 课程,然后再学习《Python 数据分析》课程。这种方式适合 有程序设计基础的学生,有利于打好扎实的编程基础,但不 适合非计算机相关专业的学生。数据分析的常规流程:熟悉工具一明确目的一获取数 据一熟悉数据一处理数据一分析数据一得出结论一验证结
论。《Python 数据分析》课程最为核心的是分析数据并得出 有意义的结论,不应该把掌握语言的语法细节作为课程的重 点,尤其在课时有限的情况下,应该让语法学习服务于分析 数据这个核心任务。当所学语法不足以支持任务解决时,再 进一步强化计算思维的培养。Python 数据分析所需要的技能主要是Python 入门知识 和NumPy 、Pandas 、Matplotlib 等第三方库的使用。在完成 基本数据分析任务时,并不需要用到太多传统程序设计技能, 完全可以直接从Excel 切入,然后使用Python 完成同样的任 务,在此基础上再完成更为复杂的任务。2方法实施的资源支持2.1应用JupyterNotebook 的云端开发环境常用的Python 环境有很多,如IDLE+PyCharm 、 Anaconda 等,其中IDLE 是简洁的集成开发环境,也是全 国计算机等级考试二级Python 科目的指定工具,大小不到 30MB o 安装基本的Python 环境对非计算机专业的学生有一 定的难度,而且使用Python 数据分析时,往往会用到很多第 三方库,安装这些第三方库经常会产生冲突,即使是教师也 很难解决,还会给很多初学者带来不少困扰。因此,在教学过程中,课程组引入了云端的Jupyter Notebook 平台。Jupyter Notebook 是基于浏览器的 Python 数据分析工具,使用方便,具有极强的交互和富文本的 展示效果,Anaconda 安装包自带Jupyter Notebooko 互 联网上有不少在线的Jupyter Notebook 平台,国内的有 米 筐(www.ricequant/)、 聚宽(www . joinquant/),国夕卜有谷歌的CoLab 。使用云端的Jupyter Notebook 平台免去了安装软件的麻烦,非常适合非计算机相 关专业的学生使用。安装第三方库也很容易,例如安装词云 库 wordcloud 的命令是!pip install wordcloud-user ,参数 user
表明安装包到用户自身的环境中。2.2速查表和在线资源由于Python 数据分析类的第三方库涉及的语法细节很 多,为了克服学生的畏难情绪,让学生聚焦于任务解决,提 高学生处理任务的效率,课程组给学生设计了速查表(Cheat Sheet) o 速查表内容简洁,涵盖了 Python 数据处理的最常 用代码,能根据学生的反馈进行及时调整,快速响应学生的 需求。对于学习能力强的同学,推荐他们从互联网下载更多
适合自己的速查表。除此之外,还提供了在线的Pandas 教程 (https ://www.yiibai/pandas )、Python 数据科学( www.yiibai/python_data_science )等在线资源来配合速 查表的使用。
3 Excel 和Python 对比学习法的应用3.1方法的优势
Excel 在数据处理方面的优势是上手容易,拥有丰富的 学习资源;制作图表比Python 更容易,而且更为美观;让学 生从熟悉的Excel 操作中去学习对应的Python 实现,而不是 直接学习Python 代码,大大降低了学习门槛,消除了学生对
代码的恐惧心理;可以采用两种方法实现同一个任务,还可 以对比结果。NumPy 、Pandas 、Matplotlib 库的使用设计细 节非常多,对比学习能够让学生聚焦于解决任务本身,而不 是语法细节。
php框架think3.2方法的实施
authorizeattribute命名空间
由于Excel 和Python 各有优势,在教学过程中并不是
所有的教学内容全部采用Excel 和Python 的对比学习法,
而是在基础内容的教学中引入了 3个任务,先使用Excel 解 决,然后再使用Python 处理同样的任务,以此掌握常用的 数据分析技能。任务1是制作产品销售数据表,主要是掌握 数据的导入、排序、列的简单计算、列数据的汇总等,该任 务会用到Excel 中的rank 函数,而该函数在Python 教材中 较少提及,因此引导学生主动探索,使用JupyterNotebook 的帮助和互联网资源来解决。任务2是制作日常费用统
计表,先在Excel 中使用分类汇总和数据透视表实现分组 统计,然后在Python 中使用GroupBy 对象的聚集函数来 解决。任务3是分析消费数据集,先使用Excel 数据透视 表快速实现,然后使用Python 的pivot table 和crosstab
信19与电10
China Computer&Communication信息化徽有2020年第22期
实现。
在此基础上,再进行横向和纵向拓展。横向拓展是把之前学习《计算机操作基础》等课程中使用Excel来解决的任务,改为采用Python来处理;纵向拓展是在此基础上使用Python来解决更为复杂的任务。
4结语
《Python数据分析》课程作为公共选修课,选课的学生未必学过程序设计语言。通过使用云端的Python开发环境,采用Excel和Python的对比学习法,能有效地降低入学习门槛,突出Python语法的重点,让学生聚焦于解决任务,受到了学生的欢迎和好评。此外,还可以把对比学习进一步拓展到SQL语言和R语言的学习中,有助于学生利用不同的数据分析工具来完成数据分析任务。
python入门教程 下载参考文献
[1]教育部办公厅.关于公布首批“新工科”研究与实践项目的通知(教高厅函[2018J17号)[EB/OL].(2018-03-21)[2019-04-21].v/srcsite/A08/ S7056/201803/t20180329_331767.html.
[2]Wing J M.Computational thinking[J].Communications of the ACM,2006,49(3):33-35.
[3]嵩天,黄天羽,礼欣.Python语言:程序设计课程教学改革的理想选择[J].中国大学教学,2016⑵:42-47,
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论