慕课讨论区人工智能答疑路径研究
sqlyog企业版注册码
2云南大学 软件学院 云南昆明 650091
摘要:近年来随着慕课课程在高等教育中越来越广泛的使用率,围绕慕课的研究百花齐放,其中慕课的互动研究也引起部分学者的关注。诸多研究指出了现阶段慕课互动性上存在的主要问题之一是师生互动模式较为单一且教师回帖滞后对学习动机的持久性产生了负影响。本研究将以慕课讨论区为例,借助人工智能与教师辅助的方式,探索讨论区教师无法及时获取学习者发帖信息导致的回复滞后问题。
关键词:慕课讨论区;师生互动;人工智能;发帖答疑
1.引言
python3基础教程慕课版电子版
随着高等教育中越来越广泛运用慕课,围绕慕课开展混合式教学研究、慕课课程建设、慕课学习有效性等的研究成为近年的热点,但其中针对慕课师生互动以及关注讨论区的相关研究还不多。
徐诗雯(2020)系统梳理国内慕课相关研究时指出虽然慕课选课率高,其辍学率也很高。研究指出学习者的负动机是影响学习者课程完成率的重要因素,影响负动机的主要因素中就包括学习者的坚持。吴冰(2021)通过对Coursera上《机器学习》课程讨论区构建多元回归模型,结果表明回帖与发帖之间的时间间隔对慕课学习者有明显的负影响,同时对学习者发帖总数有明显正向影响。慕课的泛在化学习模式对学习动机的持久性要求更高,学习者也更需要及时获得教师的有效支持,然而目前慕课主流的师生互动模式还是以讨论区发帖回帖方式进行,师生问答形式单一且课程教师往往无法及时获悉新发帖。 李诗雯(2021)通过研究中国大学慕课网上四门慕课,提出解决慕课讨论区中存在的问题除了改善提问方式外,更需要“创新互动内容,丰富互动形式。”针对讨论区发帖提问的问题,段昊昱(2018)提出在慕课平台上搭建人工智能答疑系统,利用爬虫程序获取发帖中的关键词与知识库中的信息进行相似度分析,从而自动获取答案并展示给学生。 这一研究借助人工智能代为在互联网上搜索答案,解决了学习者疑问无法及时获得回复的短板。 对于普通教师而言,专门为一门课程搭建答疑平台从技术上和日常维护上都较为困难,因此本研究探索借助人工智能和小程序,采用关键词匹配设置预设回复和邮件提醒教师手动答疑的方式,探索论坛区师生互动的新路径。
2.研究设计
2.1爬虫程序说明
本文使用爬虫技术主要实现两大目标功能:(1)获得网络资源;(2)用户操作监控;(3)模拟用户操作。网络资源获取主要指学生发帖、慕课问题内容等。用户操作监控主要是针对学生的提问、发帖、讨论等行为进行及监听,从而实时进行智能响应。模拟用户操作是借助爬虫技术实现穿梭在网页/MOOC系统中的虚拟智能机器人,使答疑系统能够与学生进行问答的等交互。
本文爬虫主要使用python程序完成,主要使用到的技术有:用户模拟登录,Cookie脚本登录,Header请求头验证,Selenium 客户端模拟,反反爬虫技术,XPATH/BeatifulSoup解析,XML解析,多线程异步技术。
魔方教程公式图解2.2 语义收集控制面板没有mysql程序怎么卸载
本研究以云南大学《通用学术英语听说》慕课的论坛区发帖为统计对象,截止到2021年8月31日,共统计4轮开课发帖共计343条。 通过对发帖标题中关键词的词频筛查,根据提问
类型将问题分为:1)常见课程问题;2)单元作业与测验;3)学习内容。 去掉重复发帖后,常见课程提问11条/次,单元作业与测验12条/次,学习内容相关303条/次。
2.3 语义分析与匹配机制
本文所构建的智能问答模块采用字符+语义双匹配模式实现问题答案的搜索筛选。通过统计和筛选发帖关键词词频和发帖内容的统计,教师去掉中无检索意义的单个关键词,例如speech,question,favorite,academic,course,technique和suggestion。对比该关键词对应的发帖内容并融合教师对该课程内容的预判,重新预制可能的关键词组合,并构建关键字词库以及关键字对应的回复数据库。针对一个新提问A,首先通过词库索引的方法匹配出A中精准的关键字,通过字符匹配的程序遍历关键字词库搜索提问关键字所对应的回复。
A组:检索关键词
B组:协同检索关键词
C组:中文关键词
take notes
taking notes, note-taking
记笔记,做笔记
form of notes
notes format, note-taking
笔记格式,笔记形式
academic 该单词不单独检索
academic paper, academic lecture,academic listening,academic speaking
(检索这一列关键词以及对应词条的协同检索词)
学术论文,学术讲座, 学术听力,学术演讲
(检索这一列以及协同检索词)
centos7挂载光驱
表1 检索关键词组 范例
次,对于相似却不相同的关键字的匹配,通过教师人工辅助使用词义分析来实现其检索。考虑到提问语言的随意性和非规范性,通过对前4轮课程发帖的统计,教师手工增加了“B组:协同关键词组”,并为A和B两组词增加了中文同义词或者近义词形成“C组:中文关键词”,同时将3组词作为人工智能检索关键词。首先基于TF-IDF(term frequency–inverse document frequency)抽取技术来获得提问中高频的关键词,基于回复的搜寻与否取其频次最高的三项。然后使用BERT中文词向量预训练模型对抽取的关键词进行嵌入获得词向量表示,同时对关键词库中的关键词也进行词嵌入,接着使用余弦相似度(Cosine Similarity)计算来得到提问关键词与各回复关键词之间的相似性分数,最后根据超参相似阈值ϛ来选取满足条件的相似度最高的词库关键词,
并通过键值映射获得其相应的回复。最后,对搜索结果相似度较弱或不相关的情况,转为教师人工回复,过程进行记录,成为回复数据库中的新增加数据集。
图1 智能答疑系统
3.讨论
图2 人工智能自动回复
图3端“新提问提醒”
图4 教师收到“新提问提醒”后登陆讨论区回复
首先,在测试中,当新提问标题中的关键词匹配回复数据库中预设回复,课程小助手代为自动回复(图2)。根据王娟(2021)对该门课程21秋季学期学习者进行的问卷调查显示,有67.4%的学习者表示希望自己的发帖能在最迟24内获得教师解答。因此当匹配度较弱时,人工智能检索程序能在新提问发出后及时发送“新提问提醒”(图3)并将提问内容展示给教师,最大程度解决了教师未能及时获知新发帖的难点,提高了教师回复的及时性和效率(图4)。
fseek函数返回的是什么
其次,预设回复能自动代答一部分课程常见提问,减轻教师每轮开课中重复回复类似提问
产生的额外工作量,同时教师也可以根据前期回复更新回复数据库中的数据,让预设回复更精细化和多样化。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。