一、引言
随着信息技术的不断发展,教育信息化的水平也在
不断提高。越来越多的人开始使用网络进行学习,这些
新技术的应用也带了教育数据的爆发式增长,探究数据
的奥秘无疑将成为未来教育领域的研究热点之一。学习
分析、教育数据挖掘、教育大数据等方法的提出都是对这
一数字时代的呼应。网络学习行为是发生于e-Learning环
境中的、与学习相关的各种行为,其行为主体是学习者,
行为客体则主要为数字化学习资源[1]。根据穆尔的学习行为交互分类理论,学习过程中有三种交互类型:学习
者与学习内容的交互、学习者与教师的交互、学习者与
学习者的交互网络学习交互行为。本研究所关注的资源
应用行为,其研究的主要对象就是关注学习者与学习资
源的交互,相对于网络学习行为而言,资源应用行为更
直接和具体,因而数据更容易被记录和分析。
毫无疑问,数据分析方法和分析技术在在线教育领
域的应用已经越来越多,其研究成果层出不穷,处于快
速发展之中。比如社会网络分析工具“SNAPP”能够从学
习管理系统中获取数据,通过可视化的方法显示学生之
间互动情况;同时,已有内容分析工具能够利用视觉分
析技术,获得学习者学习过程信息。本研究关注于网络
学习者资源应用行为分析系统的设计与实现,一方面旨
在弥补现有学习平台分析功能的匮乏,已有的众多在线学习平台大多不具有深层次意义上的分析功能,或者甚至就没有相应功能,其分析过程和方法的标准化也根本无从谈起;另一方面则是力图使得面向学习者的行为分析可以更为便捷。
二、研究目标和方法
本研究的目的在于设计开发网络学习者资源应用行为分析系统。基于已有研究,本文通过文献分析对国内外学者关于资源应用行为分析模型以及主要分析方法进行梳理,在此基础之上提出了资源应用行为分析框架,将分析过程分为描述型、诊断型和预测型,模型从宏观角度对资源应用分析系统的开发提供了建设性的意见;基于此框架,研究设计和开发了资源应用行为分析工具,此工具实现接收教师或教学工作者上传的资源应用行为数据,并通过系统内部的分析过程反馈分析结果,最终实现描述型、诊断型和预测型三方面核心功能。本研究的技术路线经历了理论建构、技术实现、应用验证三个阶段,相应地综合应用了文献分析、技术开发等研究方法。
理论建构阶段。主要研究了行为科学与行为主义学习理论、学习分析技术、学习者分类模型,并在此基础之上,依据网络学习者与学习资源交互的环境特点,提出了网络学习者资源应用行为分析模型并建立了三个维度的分析方法。
网络学习者资源应用行为分析系统
的设计与实现*
王楠,张玮
(北京邮电大学网络教育学院,北京100088)
摘要:网络学习者的资源应用行为分析是学习分析领域的研究重点。本研究通过文献分析,系统梳理了国内外学者关于资源应用行为分析的研究成果,提出了“收集-分析-应用”于一体的资源应用行为分析框架,将分析过程具体区别为描述型、诊断型和预测型三种类型,并采用“python”语言及“django”框架设计和开发了基于该框架的资源应用行为分析系统,同时利用edX和案例网络教育学院的真实数据对系统可用性进行了验证。本研究对于探索网络学习者资源应用行为特征,实现更为有效和精准的远程学习指导都有着重要意义。
关键词:网络学习者;资源应用行为;行为分析系统;系统设计
中图分类号:G420文献标志码:A文章编号:1673-8454(2019)09-0043-08 *基金项目:全国教育科学规划“十二五”课题“泛在学习环境中数字资源聚合模式及推荐机制研究”(DCA140238)。
技术实现阶段。主要研究可视化技术,数据分析方法,机器学习算法用来分析网络学习者资源应用行为数据,以期评估学习过程,诊断学习情况,预测未来表现等。
应用验证阶段。主要是在资源应用行为分析模型的基础之上,通过使用Web开发技术以及数据分析方法、机器学习算法开发和实现网络学习者资源应用行为分析工具,工具能够接收上传的学习相关数据,通过选择不同的分析方法获取分析结果。最后使用工具分析案例网院成人教育的数据和部分MOOC开源数据来验证工具的可用性。
三、相关研究
国外对于资源应用行为的研究更多偏向于应用实践方面。自2012年学习分析技术提出以来,越来越多的学者开始关注并研究学习者在网络学习中的学习行为。美国普渡大学通过建立预测模型和使用相关可视化技术,对学习者的学习情况进行实时跟踪,当学习者可能出现学业不通过等危险情况时,可视化信号就会将此信息传递给教师和学生,以便改善学习者的学习效果[2]。
A Anderson、D Huttenlocher等人通过对Coursera平台上的课程数据分析得出课程参与度与学生绩效的关系,优秀学习者的学习习惯以及激励机制对学生参与度的影响[3]。麻省理工学院的PJ Guo、J Kim、R Rubin分析了edX 上690万条视频观看记录,统计分析后得出结论:少于六分钟的视频最吸引人[4]。本研究调研了现阶段关于资源应用行为的国内研究,时间范围从2004年到2016年,共搜索出1130篇文献。
纵观目前国内的研究成果,发现大体可以分为以下几个方向:
(1)关于网络学习行为的理论研究,其中包括天津外国语大学杨丽娜等关于行为动机的研究,文中从心理因素、技术因素和资源因素三个方面建立了行为发生的前因模型,并对提出的因素进行了验证[5];华中师范大学彭文辉在对学习行为内涵深入研究的基础上,提出了一个学习行为的OCCP分类模项,以及网络学习行为的“S-F-T”三维分类模型,这两种模型是抽象和形式化描述学习行为序列的基础[6]。辽宁师范大学李玉斌等学者以计划行为理论为指导,构建起具有9个潜在变量的网络学习行为模型(USEBM)[7]。
(2)关于网络学习行为分析系统的研究,其中包括陕西师范大学王丽娜以对网络学习行为系统分析为基础,结合网络学习行为评价的目的和指标,设计了网络学习行为的评价模型[8];华中师范大学黄克斌等通过分析常见的网络学习行为量化参数,设计了一个智能化的网络学习行为分析系统[9];中南大学吴玲艳运用Web Services 和Web日志挖掘等技术,设计并初步实现了包含行为采集、行为统计分析、学习评价三个模块的网络学习行为分析评价系统[10]。
(3)关于行为指标的分析研究,国家开放大学魏顺平等通过记录学习者对网络课程不同模块的浏览及跳转数据,分析学生对资源的使用情况[11]。国防科学技术大学范洁通过对决策树中C4.5算法的研究,提出了一种基于属性相关性的C4.5决策树规则生成算法预测学生成绩[12]。东北师范大学马杰等人运用多元回归分析预测与学生课程总分呈显著相关的教学模块,通过预测模型快速定位重点模块,从而提高教学效果[13]。
综上所述发现,国内外在资源应用行为的研究上收获颇丰。各种模型、各种系统、各种分析方法层出不穷。将这些研究仔细分析对比以后不难发现,虽然学者们在各自研究的基础上都取得了一些突破,但大家更多是依照自己的研究领域和方向,以及能够获得的资源设计分析系统和方法,而各种方法和系统之间差别较大,没有形成一个统一的体系或者框架。这就导致研究成果的实践性比较差。现如今,越来越多人来到线上进行学习,但是在线平台和系统的不同也导致了数据整合上的困难,虽然大数据分析技术已逐渐的成熟,但是在基础设施的建设上如达不到一定的统一,这将使得未来对网络学习者资源应用的分析过程变得更加复杂。
四、前期研究
本研究在对这些学习分析模型进行分析总结的基础之上,加之对学习者在网络学习环境中的资源应用行为进行了相关研究,提出了网络学习者资源应用行为分析框架,如图1所示。本模型主要借鉴了学习分析模型中的三个主要过程和循环结构。
资源应用行为的整个分析过程主要是由数据收集、数据分析和知识应用三个部分组成。第一个阶段是数据收集。收集的数据主要来自于在线学习平台的数据库以及日志文件,数据库和日志文件里保留了学习
图1资源应用行为分析框架
者与网络学习资源交互的大部分行为数据。由于数据的来源不同,所以需要将收集到的数据进行相应处理,其中包括标准化处理、删除存在误差的数据以及对空值进行填充等。资源应用行为分析模型中使用
的数据是学习者与网络学习资源交互时产生的行为数据,这些数据可以根据不同的特点分为行为过程数据和行为结果数据。其中,行为过程数据是指网络学习者在学习过程中与学习资源交互时产生的操作型数据,例如:登陆时间、登陆时长、练习时长等。行为结果数据是指由一连串操作行为以后产生的结果型数据。例如:学生练习的成绩、系统对学生的学习情况的评价、是否通过考试等。
第二个阶段是数据分析。数据分析阶段基于数据分析方法、机器学习算法等,对数据进行分析。此模型中将数据分析分为三种不同类型的分析,主要包括:描述型分析、诊断型分析、预测型分析。描述型分析是根据事先分析的成果,将某些数据集中,以某种直观、概括、全面的形式将需要表达的信息展现出来。教师可以通过这些直观的结果迅速发现整个学习过程中的一些特点,总结出一些规律等。由于学习者心理因素、成长环境等因素的不同,导致在在学习过程中表现出特点也有所差别,识别出这些不同不仅可以帮助教师更好的了解学习者,为个性化教学提供保障。诊断型分析就是利用资源应用行为数据建立学习者分类模型,接着再根据模型对学习者进行分类,并针对不同的学习者提供个性化的指导方法,改善学习结果。教师需要根据诊断的结果,按照学习者的偏好和习惯组织学习活动和资源,以便取得更好的教学效果。预测型分析主要是根据学习者在学习平台中留下的行为数据,使用机器学习算法建立数据与数据之间的关系,最终达到预测学习绩效的目的。此类型的分析可以帮助教师到那些可能无法通过考试的学习者,教师需要对这些学习者采取必要的措施以改善学习行为。
第三个阶段就是知识应用。知识应用的对象主要是教师、学生以及从事教学相关的工作者。经过相应的
数据分析以后,教师根据分析的结果,结合自身教学经验和已知的学生特点进行相应的知识应用。由于分析类型的不同,知识应用的方法也不相同。可以分为可视化、个性化和预测三种。可视化是指将数据库中的数据用图表的方式呈现,利用计算机的处理能力将海量的数据转换成直观可见的图形图像,将复杂不容易理解的信息表示出来。个性化是根据诊断型分析中分析结果,通过网络学习者在学习过程中资源应用行为的不同表现,诊断出
属于具体的类别,然后针对不同类型的学习者,提供个性化的指导方法。预测是将当前学生的资源应用行为放入预测型分析模型中,对学生下一阶段学习结果或者学习行为进行预测。
最后,模型还强调了循环结构,模型将知识应用的结果反馈给收集数据、分析系统的管理者,或者教辅人员根据返回的结果重新设计和改善收集的数据,提高分析的准确度。需要注意的是,整个分析过程是在宏观和微观环境下工作的,这里的环境包含了影响整个分析过程的各方面要素条件。
五、系统设计及开发
根据资源应用分析工具自身的特点和使用环境,整体的设计都需要遵循以下几个原则:
(1)简便性
分析工具的使用者大多是一些计算机技术能力较弱的教师,对于他们来说只需要掌握一些简单的操作获
得自己想要的结果。所以在这个系统的功能设计和流程设计中一定要注意操作的简便性,能够使计算机水平一般的人也能够使用此工具。
(2)独立性
如上所说,工具的分析功能可能随时需要调整,在这个过程中就需要注意系统的独立性。其中每个分析功能需要独立出来,当系统需要改变某个分析方法的时候,要保证其能够不影响其他功能的分析过程。
(3)可扩展性
可扩展性能够保证系统对变化及时做出反应。系统的功能不仅需要调整,更多的时候需要增加某个某块或某种功能,此时较强的可扩展性能够使系统迅速适应这种变化。
(4)准确性
毋庸置疑,此工具最主要的功能就是分析方法的使用。而这些分析方法必须保证其一定的准确性,只有正确的分析结果才能帮助教师了解和改善学习者的学习情况。
分析工具的整个工作过程可以看做是一个“黑盒”,工具的使用者只需要按照工具给出的格式上传数据,具体分析功能将交给系统来完成。使用者在上传文件之后,点击自己需要分析的部分就可以获得相应的
分析结果。因此,根据系统功能确定系统的输入和输出,系统的输入是用户上传的学习者相关数据,系统的输出是具体的分析结果,如图2所示。
基于前期研究成果和系统设计思路,该系统包括如下三个模块:
html怎么实现登录验证功能(1)数据交互模块
本模块主要实现了用户与服务器端数据交互的功能。数据交互模块主要分为两个部分:格式下载和数据上传。格式下载是为了统一上传的数据格式便于进行分析。用户可以通过页面左上角的格式下载链接,
下载本工具能够支持的数据格式。数据的上传主要是由教师或者教学工作者按照所要求格式将排版好的学习者行为数据上传到服务器中。系统目前主要支持xlsx 格式的Excel 文档和txt 格式的文本文档。上传的文件不仅仅用
于分析,还会保存在服务器中,为以后开发用户管理系统做准备。
(2)数据分析模块
用户上传了数据以后,进入分析主页面,如图3所示。顾名思义,此模块实现了对于上传数据的分析。按照前面建立的模型,将分析分为三种不同的类型:描述型分析、诊断型分析和预测型分析。
①描述型分析
描述型分析中有描述学习时间、发帖量、作业时间与成绩关系的散点图,此方法清晰展示了全部学习者资源应用行为与成绩的关系,由此可以发现行为对成绩的影响;还有描述学生学习时间变化的折线图,教师可以根据此图发现后进学生;以及描述资源偏好的直方图,教师可以借助此结果进行不同学习资源的推荐。图4所示为描述型分析选择页面。
②诊断型分析
描述型分析包括了根据格雷戈克学习风格模型的
学习风格诊断,根据威特金认知风格模型的认知风格诊断,以及国内外文献中已经论证使用的学习困难诊断,作业完成效率诊断和稳定性诊断。每一种诊断都是依据先前研究者的研究结果或在其基础之上根据自身的研究环境和条件进行学习者分类,并对不同的学习者提出了针对性建议。其中格雷戈克将学习者分为四种不同的学习风格,包括喜欢通过直接的动手经验学习,希望教学组织得井然有序的具体──序列型风格;能通过试误法,从探索经验中迅速得出结论的具体──随机型;善于理解以逻辑序列呈示的词语或符号信息的抽象———序列型;善于从演讲中抓住要点,理解意思,并能对演讲者的声调和演说风格做出反应的抽象──随机型。威特金认为风格诊断将学习者的认知风格分为倾向于以外在参照作为信息加工依据的场依存型和倾向于更多利用内在参照作为信息加工的依据场独立型。学习困难诊断模型主要参照了国外学者Vincent Aleven 等人设计的求助行为模型(help-seeking behavior Model)来诊断学生在学习过程中是否遇到问题,作业完成效率诊断和稳定性诊断则使用了JoséA.Ruipérez-Valiente、Pedro J.Muñoz-Merino 等人使用的数据分析方法进行分析对比,发现存在问题的学习者。
③预测型分析
在预测型分析中,主要使用了关联分析和分类决策树两种分析方法对网络学习者的下一阶段成绩进行预测。决策树预测主要根据前一阶段学习者的表现,各
个模块的学习时间和成绩来预测最终是否可以通过此课程。关联分析主要是通过同学在各个章节的成绩来预测章节之间是否存在关联。图5所示为预测型分析选择页面。
(3)知识应用模块
根据分析方法的不同,知识应用也大致分为三种类型。针对描述型分析的结果将数据通过图表的方式呈现,利用计算机的处理能力对海量数据进行处理、分析,最后转换成客观可见的图表。诊断型分析的结果由两种不同形式体现,一种是反馈可视化的结果,通过图表可以清晰判断学习者的类型。另一种的分析结果会给用户反馈学习者的诊断类型,而且针对不同学习者还会提供
图2系统“黑盒”模型
图4描述型分析选择页面
图3资源应用行为分析主页面
专业的建议。预测型分析则根据建立的预测模型反馈预测结果。
在技术支撑方面的研究点主要包括可视化、机器学习以及网页设计技术。机器学习是本研究中开发分析工具的重点支撑技术,可视化技术是分析结果呈现方面的研究重点,网页设计技术应用在形成工具时的网页显示和交互。由于分析工具的特性以及前期对于两种结构的调研,最终选择了B/S 作为系统的架构。其最大的优点就是对系统使用者的友好。本研究考虑到开发周期和系统的维护,选择使用“python”语言以及其开源框架“django”进行开发,可视化方面使用了“Google Char”,其
具有良好的跨浏览器兼容性。系统数据交互功能的实现,文件下载,主要是指用户从服务器端将文件下载到本地的过程。本研究通过超链接获取文件地址,然后“read”函数读入文件,最后通过“django”中“Stream⁃ingHttpRespons”对象传输到浏览器中。其中在实现文件下载的过程中,方便处理较大的文件,使用了迭代器。数据上传实现了将数据文件上传到服务器中。当“Django”处理一个上传文件的时候,文件数据被放在“req.FILES”中,“Class FileForm”创建了一个能够接收“req.FILES”文件数据的表单视图。通过“POST”方式,可以获取“req.FILES”文件,再使用“file”的写操作将文件写入服务器磁盘之中。系统通过正则表达式来判断上传文件的格式,符合格式的将可以进行下一步分析工作。
以诊断型分析中的作业完成效率诊断为例。系统中,在相同时间内,得分较高的可以认为效率高,在分数同样的情况时,可以认为花费时间较少的效率较高。根据这个结论,本研究用“Score /Time”来表示效
率。但是排出单次做题偶然性,又引入了尝试次数此项数据。最终效率的计算公式为“Score ×ATTEMPT_NUMBER/Time”(作业得分×尝试次数/总时间),其中“ATTEMPT_NUMBER”表示尝试某一章节练习的总次数,“Time”代表这些尝试所花费的总时间,而“Score”代表了所有尝试的总得分。从公式中可以发现,算出的结果越大则可以认为效率越高。如果某个学生多次尝试某章节习题,虽然
时间也随着变多,但是随着自己熟练度的增加,将“ATTEMPT_NUMBER/Time”提高,便可提高自己的效率。由于每门学科或者教学环境的差异,为了更准确地到效率突出的人,又加入平均值这个数据。通过把效率和平均值相比较就能到那些“特殊的人”。此诊断方法只会反馈诊断结果,对于那些效率较低的人,则需要教师通过一些个性化的指导措辞来改善他们的行为[14]。最终反馈的可视化形式如图6所示,横坐标代表每个学习者,纵坐标代表了效率的数值。图中的横线表示平均水平。从图中可以看出,第三个学生的学习效率超过横线很多,可认为学习效率较高,对于第六个学习者由于学习效率较低,教师需要通过单独进行沟通来改善此学习者的学习效率。
六、系统应用
为验证该系统的有效性,本研究中采用了两方面数据来进行测试,分别是基于edX 平台的开放学习者资源应用行为数据,以及某案例网络教育学院成人教育数据。
该验证部分的MOOC 数据,来自于麻省理工学院在edX 平台上开设的计算机科学及编程导论课程,本研
究选择其在2013年春季学期参加此课程的学生资源应用行为数据。此数据集是由MOOC 课程的教辅人员整理后提供的“csv”文件。分析数据表中的属性,大部分是学习行为结果数据,对于诊断型和预测型的分析支持度不高,所以把这部分数据进行描述型分析的数据应用。
本文工具验证使用的另一部分数据是来自案例网络教育学院成人远程教育学习过程中产生的数据。这些数据都是直接来源于数据库,未经过任何整理。此部分数据较为详细,由多个数据表构成,由数据表显示,数据
图5预测型分析选择页面
图6学习效率诊断反馈图

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。