中文期刊知识图谱研究范式的优化
作者:贾维辰 李文光 余明媚
来源:《中国远程教育》2020年第11期
【摘 要】
在科学知识图谱领域,代表性软件CiteSpace对于期刊数据的分析具有重要价值,但是CiteSpace软件对中文期刊数据的分析仅能完成几类基础聚类和数据分析,如若希望做深入解读就需要对已有中文期刊CiteSpace研究范式进行完善和创新。本研究通过深入分析CiteSpace两篇代表性文献,提取了标准研究范式,从CSSCI收录的文献中梳理出通用的CiteSpace中文期刊研究范式,并将两种范式进行对比,探究中文期刊研究范式需要优化之处。基于此,本研究通过使用自然语言处理技术(简称“NLP”)主题挖掘的典型模型Latent D
irichlet Allocation(简称“LDA”)处理论文摘要数据,通过这种技术完善文献检索策略和文献数据处理方法,提出的“优化范式”丰富了中文期刊CiteSpace研究来源数据,增强了中文期刊CiteSpace研究内容的深度和系统性,并通过对国内人工智能在教育领域应用的研究进一步验证了该“优化范式”的可操作性,揭示出国内人工智能在教育领域应用研究的前沿主要聚焦于智慧学习环境的构建和相关技术支持。在与国内CSSCI同类型文献的对比中,“优化范式”在数据收集、数据分析、数据解读三个阶段的表现均优于传统中文期刊CiteSpace研究范式。
【关键词】 期刊知识图谱;文献计量;LDA模型;CiteSpace;研究范式;人工智能教育;中文社会科学引文索引(CSSCI)
【中图分类号】 G420 【文献标识码】 A 【文章编号】 1009-458x(2020)11-0001-10
随着20世纪90年代信息可视化技术的发展,科学知识图谱在21世纪初迅速成为科学计量学的一个新领域,诸多可视化分析软件被陆续引进国内。CiteSpace软件引入中国后,得到学术界极大关注和推广应用,并取得丰硕成果(Lu, T., Hu, & X. 2019)。但是随着研
究的深入,我们发现CiteSpace软件对中文期刊的数据分析仍处在表层(郭丽君, 等, 2018; 刘勇, 等, 2018; 王建华, 等, 2019),仅能完成几类基础聚类和数据分析。要解决这一问题,迫切需要对已有中文期刊CiteSpace研究范式进行完善和创新。
正则化综述 一、CiteSpace回顾
(一)CiteSpace理论基础
CiteSpace软件是美国德雷塞尔大学计算与信息计量学院陈超美教授在怀特(White & Griffith, 1981)作者共被引分析理论和库恩(Kuhn, 1962)科学结构演进理论的基础上使用Java语言开发的信息可视化软件。该软件主要用于分析和可视化作者共被引网络,生成知识概念图谱、知识聚类图谱,帮助研究者探索知识领域中的研究热点、前沿和潜在新趋势。
CiteSpace主要包括“研究前沿”和“知识基础”两个概念模型(陈悦, 等, 2015)。
· 研究前沿模型。某个科学领域中的施引文献聚类。从施引文献组本身内容和施引文献组引用参考文献两个方面体现研究前沿的特征。
· 知识基础模型。某个学科领域中相对于研究前沿的所有前期文献集合。
CiteSpace基于以上两个概念模型,通过信息可视化技术基础实现对研究领域的研究热点、前沿和潜在新趋势的探索和预测。
(二)CiteSpace在教育学领域的应用
CiteSpace软件在教育学领域的应用涵盖教育学多个子领域或研究主题,研究者借助CiteSpace对子领域的研究热点、前沿和潜在趋势进行文献计量分析和预测。涉及的子领域主要包括大数据学习分析(Wang, J., et al., 2016; Tho, S. W., et al., 2017; 闵光辉, 2020)、新技术在教育领域的应用(Wang, F., et al., 2018; Jing, et al., 2019; 徐坚, 等, 2017; 任利强, 等, 2018)、学科教学(Wang, B., Wang, & Z., 2018; 李韬, 等, 2019; 孟宇, 等, 2019)、教师专业发展(何灿娟, 等, 2017; 张华阳, 等, 2018; 郭丽君, 等, 2018)和学生素养(Zhao, Y., et al., 2016; Yu, L., et al., 2018; Stopar, K., et al., 2019; 任艳莉, 等, 2018)。CiteSpace可以帮助教育学领域研究者发现领域研究热点,对教育学发展趋势和研究方向进行预判并做出决策。
二、CiteSpace研究范式
(一)英文期刊CiteSpace研究范式
在英文期刊CiteSpace研究范式方面,CiteSpace开发者、大连理工大学教授陈超美教授最具权威性,我们对陈超美教授在2012年和2017年发表的两篇论文(Chen, et al., 2012; Chen, 2017)进行分析后进行了总结,如图1所示。
英文期刊研究范式包括三个阶段:数据收集、数据分析、数据解读。
· 数据收集阶段。选择Web of Science(WoS)数据库,通过采用系统的综合检索策略,优先保证文献查全率。完成数据采集和数据清洗后将数据传入CiteSpace进行处理。
· 数据分析阶段。生成“双图叠加图谱”“概念树图”“时间线分析”“聚类图谱”等数据可视化图谱。
· 数据解读阶段。对各类图谱进行解读,陈超美教授的研究路径是从宏观到微观,从直观到复杂,从整体到局部。具体分析内容包括:“学科分析(宏观)”“主题词分析(微观与直观)”“共被引分析(复杂与整体)”“典型聚类分析(局部)”“结构变异性分析(特殊)”。同时在聚类层面上分析,一般会选取较大的或较新的典型聚类进行分析,在每个典型聚类分析中都会提供“概念树”“时间线及细节图”“重要被引文献”“重要施引文献”。基于以上的解读,最后生成该领域的研究热点、研究前沿、研究趋势预测以及核心研究者研究动向等结论。
(二)中文期刊CiteSpace研究范式
与英文期刊类似,中文期刊CiteSpace研究同样包括三个阶段:数据收集、数据分析、数据解读,如图2所示。但是因为数据库字段不完整等原因,能够实现的分析项目远少于英文期刊。
· 数据收集阶段。通常选择中国知网(CNKI)数据库或中文社会科学引文索引(CSSCI)数据库其中一个数据库,采用单关键词或多关键词的方式进行检索。数据采集完成后大多数研究者不会对数据进行清洗(在近几年发表的CSSCI文献中仍可以到研究机构重复的聚类分析图(王小明, 2018))就直接传入CiteSpace进行处理。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论