图1
学习者地域分布
基于Tableau 实现在线教育大数据的可视化分析
陈佳艳
(南京邮电大学教育科学与技术学院,江苏南京210046)
摘要:学习者在慕课平台上的所有学习行为都会以形式多样的数据形式记录下来,这些大量
的学习行为数据,为教育研究者进行学习者分析提供了条件。对教育大数据的挖掘可以达到深入了解学习者学习状态和差异的目的,学习分析可视化便于更直观地展现分析结果。Tableau 可视化分析软件无须用户编写代码,操作简易、分析灵活,适合非计算机专业的教育研究人员使用。文章利用
Tableau 软件对Canvas Network 开放学习者数据集进行探索和分析,力图多维度展现慕课学习者特征和学习状况,为在线学习者分析研究提供借鉴参考。
关键词:学习分析;Tableau ;可视化分析中图分类号:D631.15
文献标识码:A
收稿日期:2017-12-22
作者简介:陈佳艳,南京邮电大学教育科学与技术学院,研究生在读,研究方向:学习分析。
新媒体联盟(New Media Consortium )认为学习分析利用数据收集工具和分析技术,研究分析在线学习者学习参与、学习表现等相关数据的过程,进而
达到对课程、教学和评价进行实时修正的效果①。学习分析技术最终要实现数据分析结果的可视化②。可视化数据与图像,能够直观地呈现数据分析结果,更好地实现学习分析的目的。学习分析的可视化是学习分析能够被广泛应用的关键性一环,是学习分析这一应用的基本特征和属性③。
一、Tableau Desktop Public 简介
Tableau public 是Tableau 公司开发的桌面系统
中国在线编程中完全免费的一款数据可视化工具,可以用来实现交互的、可视化的分析和仪表盘分析应用,在商业智能(Business Intelligence )领域应用广泛。Tableau 支持的数据源广泛,常见有Excel 表格、文本、JSON 、统计文件等,也可以连接数据库服务器。
Tableau 采用点击拖拽的方法产生图表,不需要开发和编程基础,并且有用户界面友好、响应速度快等优点,对于没有计算机背景的教育研究人员完全容
易使用。此外,Tableau 能够跟随思维轨迹,快速进行视图切换,而不是使用向导或是编写程序,工作效
率比现有的数据分析工具高出数倍④。本文利用Tableau public 对Canvas Network 开放数据集进行
探索和分析,力图多维度展现慕课学习者特征和学习状况,为了解慕课学习者状态研究学习特征提供
借鉴参考。
二、可视化分析
本文研究数据来自在线教育网站Canvas Net ⁃
work 开放的2014—2015年学生行为记录数据集,整个数据集使用逗号分隔符(.csv )文件保存,包括10
类学科238门课程325199条用户-课程行为数据。
(一)学习者地域分布及学历分析
慕课最大的特点在于学习者数量的庞大性和类别多样性,它没有参与人数、时间和地点的限制⑤。本文根据数据集中国家代码字段,共统计得224个国家地区。Tableau 内置的地图服务器可以为每个位置数据关联经纬度值。将字段拖放到视图上就可以快速创建学习者分布地图。如图1所示,人数值越多气泡符号越大。从图中可以看出Canvas Network 的学习者覆盖了世界六大洲,其中人数较多的地域分布于南美、北美和欧洲,美国参与者人数最多,其次是英国、加拿大。亚洲国家中印度学习者最多,其次是中国
。
123
表1
学习者行为聚
类图2中国学习者学历层次
在线课程学习平台的学习者大多数具有较高的学历层次,通过统计数据得知该平台学习者中硕士人最多占比36.5%;其次完成4年大学学位占比22.3%;博士人最少,占比7.5%。利用Tableau 仪表板功能,可将多张工作表放置同一个仪表板形成交互化图表。例如将地域分布图和各国学历统计图组成一个仪表板,点击地图中任意一个国家,就可清楚地看到该国参与者的学历层次情况。中国学习者学历层次如图2所示,硕士人和两年专科人占比最多,四年本科其次,博士人最少。与总体分布情况不同的是四年本科人占比较少。
学习慕课课程需要有一定的基础知识、自学能力和自控能力以适应课程难度和师生分离的学习状态。非英语母语国家的学习者也可能受语言的影响而参与度不高。
(二)学习者行为聚类分析
慕课学习者学习行为、学习风格多种多样,将学习者分类便于观察每类的特点,深入分析不同类学习者的学习状态。本文采用数据挖掘中最常用的分析方法———聚类分析来对成千上万的学习者进行分类。支持聚类分析的数据统计软件很多,SPSS 功能设计比较齐全,但是用户图形界面复杂,编程困难;SAS 有大量的统计分析模块,但人机对话界面不太友好,价格较高⑥。Tableau 的集统计功能使用k-means 均值统计方法,仅需简单拖放字段即可执
行聚类分析。
本文选取模块完成比例(completed-%)、模块浏览量(ncontent )、学习交互数(nevents )、讨论区发帖数(nforum-posts )构成聚类中心,对数据集进行分析。聚类结果如图3所示。聚类的k 值可系统自动判断也可进行自定义,去除无效数据后系统生成3类集。其中第一类学习者共510人,第二类270人,第三类61人。总体来看这三类学习者除了讨论发帖量差异不大,其他三项学习行为均差异较大。
第一类学习者平均模块完成比例4.9%,平均模块浏览量26.029,交互总数244.19,这三项学习行为都
属最少。本文将这类学习者定义为半途而废者类型,这类学习者的学习行为通常集中在课程前期,随着课程推进坚持下来的较少,他们通常浏览部分课程列表或是模块内容,但很少完成作业。
第二类学习者平均模块完成比例10%,模块浏览量96.96,交互总数269.9,这三项学习行为均占第二位,平均发帖2.4在三类集中最多。本文将这类学习者定义为观察学习者类型,他们一般愿意浏
览模块内容但不愿意完成课程作业。
第三类学习者模块完成比例45.75%、模块浏览量接近全部、学习交互数最高。该类学习者属于坚持学习者类型,在课程期间参与度高,学习目标明确,能够进行持之以恒的学习,但讨论区讨论不够活跃。
图3为学习者行为聚类可视化结果,三类集由不同的颜标注,化数据于图像,大幅提高了人眼采集信息的速度。
(三)不同类型学习者分析
学习者行为多种多样,但学生成绩仍是评价学习效果的重要指标之一,本文将分类得到的三类学习者进行均分比较,结果如图
4所示,与上文分析结果一致,第一类半途而废者类型均分最低为0.1655分,第二类观察者类型均分居中,第三类坚持学习者类型均分最高为0.7254分。这一现象充分说明了慕课完成率低退出率高的弊端。
三尧结束语
在线学习平台上记录的大量学习者数据,可以充分利用并发挥数据的价值,使数据转变为有用的信息,并服务于教学决策和学习优化。从分析实例可以看出,慕课学习者分布广泛、学历背景和学习行为存在显著差异。对学习者划分特征组,便于
集项数Completed%ncontent nevnent Nforum-posts 1
5100.04912426.029
244.19 2.058822700.1043896.304269.9
2.437
3
61
0.45751
99.262
593.98 2.0328124
behavior data provide the conditions for learners to analyze for education researchers.The mining of educational big data can achieve the purpose of in-depth understanding of learners'learning status and differences,and learning analysis visualization can facilitate more intuitive display of the analysis results.Tableau visual analysis software does not require the user to write code,easy to operate,flexible analysis,suitable for non-computer education professionals to use.The article explores and analyzes Canvas Net⁃work's Open Learner's dataset with Tableau software in an effort to reveal the characteristics and learning status of the learners in
and provide references for
online
learners to analyze and study.
learning analysis;Tableau;visual analysis
图3学习者行为聚类可视化结果
总结每类的特点,深入分析不同类学习者的学习状
态。使用Tableau强大的可视化分析功能可以直观
呈现分析结果让数据结论明确易懂。无须用户编写
代码的特点,适合非计算机专业的教育研究人员。
未来将对数据做更深入地分析,以期发现更多有价
值的学习者行为特征,为在线学习者分析研究提供
更多借鉴参考。
注释院
①徐鹏,王以宁,刘艳华,等.分析学习变革———美国《通过教育
数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教
育杂志,2013,(6):11-17.
②徐漫.基于开源MOOC平台的学习者学习行为分析与研究
[D].东北石油大学,2016.
③许文,付达杰,袁芳.大数据背景下学习分析可视化呈现技
术研究[J].电脑知识与技术,2017,(20):22-24.
④Nandeshwar A.Tableau data visualization cookbook[M].Packt
publishing Ltd,2013.
⑤王敏.基于行为日志数据的MOOC学习者学习行为分析研
究[D].华东师范大学,2016.
⑥程香.基于R的在线学习者特征聚类分析[J].长春大学学
报,2016,26(06):31-34.
图4各集均分柱状图
125
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论