*本文系2020年天津市哲学社会科学规划项目“多源异构数据的学术论文评价体系构建与实践探索研究”(项目编号:TJTQ20-001)研究成果。
摘要文章对比中美生物医学论文在线保存与分享的差异,揭示可见性与学术影响力的关系,为我国“双一流”建设和国际论文评价提供新视角,进而为我国科技信息交流平台建设与服务提出对策。采用抽样调查的方法,以PLoS 期刊论文为样本,选择中美高校P 大学和H 大学为对比对象,展开描述性统计、相关性分析、两个独立样本的非参数检验等研究。研究发现:总体上,生物医学论文指标的均值均为H 大学的论文高于P 大学的论文。指标的覆盖率,除Figshare 外,均为H 大学的论文高于P 大学的论文;使用量、被引量、保存量两两之间显著正相关,与Figshare 仅微弱相关。H 大学论文Mendeley 保存量与被引量的相关系数大于P 大学此类指标间的相关系数。中美生物医学论文在Mendeley 保存量的分布具有显著差异,Figshare 分享量的分布无显著差异;我国高校PLOS 论文的国际传播度尚低,用户在Mendeley 中保存、阅读的较少。我国科技信息交流平台应完善功能,提供集成服务,增加学术文献的可见性和可获取性。国产化社交媒体指标缺失,可能在一定程度上影响了P 大学论文的可见性。
关键词生物医学在线保存与分享可见性学术影响力Altmetrics 论文级别计量
引用本文格式匡登辉,樊振佳.一文两面——对PLoS 期刊论文可见性与学术影响的分析[J].图书馆论坛,2023,43(6):29-37.
On the Relationship Between Visibility and Academic Impact ——Taking PLoS Papers for Example
KUANG Denghui &FAN Zhenjia
Abstract
This paper tries to compare the online saving and sharing of Chinese and American biomedical papers ,
so as to reveal the relationship between visibility and academic impact ,to provide a new perspective for the evaluation of international papers in the development of “Double First-Class ”universities in China ,and to put forward suggestions for the construction and service of scientific and technological information exchange platforms
in China.This paper takes PLoS papers by P University in China and H University in the U.S.as samples ,and then makes a detailed analysis of these papers ,by means of descriptive statistics ,correlation analysis ,two-independent-samples tests and so on.The result shows as follows :Overall ,the average value of H University papers ’indicators is higher than that of P University papers ’indicators.The coverage rate of H University papers ’
indicators ,except Figshare ,is larger than that of P University papers ’indicators.There is significant positive correlation between usage ,citation ,and saving ,while there is only a weak correlation with Figshare.The correlation coefficients between the Mendeley and citations of H University papers are greater than those of P 一文两面
——对PLoS 期刊论文可见性与学术影响的分析*
匡登辉,樊振佳
0引言
在Web2.0时代,数字革命和科研范式变革加快,学术交流工具和路径不断创新,学术在线社交、数字化成果分享成为学者交流的重要途径,用户在线评论及其在社交网络的互动交流也成为科学评价的补充计量学指标。我国高校“双一流”建设成绩显著,16个学科位于世界前五,SCI论文总量居世界第二[1],生物医学原创性科研呈跨越式发展,高水平论文大量、快速涌现。社交媒体的繁荣加速了学术论文的传播,也影响科学成果的计量与评价。相关研究集中于探讨学术论文传播模式[2]、传播途径[3]、传播平台差异[4]、用户分享动机[5]、学术论文的社交媒体可见性预测研究[6]等方面,鲜见对高校生物医学论文可见性、学术影响差异性的研究。下述问题亟需厘清:我国生物医学研究论文的可见性、学术影响与世界一流大学的差距在哪里?论文的可见性与学术影响的相互关系如何?我国与美国的生物医学论文在可见
性与学术影响方面有何差异?对提高我国学术论文的可见性、学术影响及建设我国科研论文和科技信息交流平台有何启示?鉴于此,本文采用抽样调查,运用描述性统计分析、分组比较、Spearman相关性分析、两个独立样本的非参数检验等方法,以P大学、H大学在PLoS(Public Library of Science,科学公共图书馆)上发表的生物医学论文为数据源,对标世界一流高校,集中考察论文层面的Altmetrics指标,分析其在线保存与分享的特点及差异性,揭示论文的可见性与学术影响的关系,探索“双一流”建设背景下科学成果评价的新视角,并思考其对我国科技信息交流平台建设与服务的启示。
1国内外关于Altmetrics与高校、机构的研究述评
传统学术引文评价存在局限,如引用的时滞长、“马太效应”“睡美人效应”[7],与社会生活息息相关的学术成果却在社交网络上广泛传播,影响力实时产生,即时衡量学术全面影响力的Altmetrics应运而生。Altmetrics由Jason Priem2010年首次提出[8-9],通过计量开放学术交流平台上的用户交互行为,衡量科学成果的影响力。成熟的Altmetrics工具包括Altmetric. com、ImpactStory、Plum Analytics、PLoS ALMs (Article-Level Metrics,论文级别计量)。Altmetric以杜克大学、曼彻斯特大学为例,突出展示高校的科研成果,引导大众了解科学进展,推进参与科研[10]。国外,Madjarevic 等描述英国、美国3个研究型高校对Altmetrics 的使用情况,了解各部门对Altmetrics的认识、应用和潜力[11];Bangani通过Google Scholar获得论文的引文量、通过DSpace获得论文的Altmetrics数据,分析美国西北大学工程学科电子学位论文的影响力[12];Vrki c等调查萨格勒布大学医学院科技期刊论文的Altmetric表现,对比国
际期刊论文和本国期刊论文、英语论文与克罗地亚语论文之间Altmetric的表现差异[13];Parabhoi等调查1971-2018年桑巴尔普尔大学出版物的Mendeley读者数[14],发现Mendeley 读者数与Scopus引用为低度相关(r=0.330)。
University papers.The distribution of Mendeley saving of Chinese and American universities’papers has a significant difference,while the distribution of Figshare has no significant difference.The international accreditation of PLoS papers by Chinese scholars is still low,and users save and read less in Mendeley.The lack of local social media indicators may have affected the visibility of P University papers partly.Therefore,Chinese scientific and technological information exchange platforms should improve its function,provide integrated services,and increase the visibility of and access to academic papers.
Keywords biomedical;online saving and sharing;visibility;scholarly impact;Altmetrics;ALMs(Article-Level Metrics)
国内对Altmetrics与高校、机构的相关研究,多围绕高校机构知识库展开,采用Altmetrics 视角,集中评价学者影响力[15]、在高校机构知识库中的应用[16-18]、机构知识库引入Altmetrics的模式分析[19]等,但利用Altmetrics评价科研机构论文可见性与影响力的研究少,仅见杨柳等以Plum Analytics为数据源,
对目标机构的2012-2015年间引用数据与Altmetrics数据的相关性进行分析[20];杨思洛等对PLoS论文层面多指标、多维度分析,对比中美开放存取论文影响的异同[21];赵蓉英等基于被引频次和使用次数,对中美图书情报学领域国际学术论文影响力进行比较[22];易淑琼引入Altmetrics指标,评价机构的学科竞争力[23];余厚强等选取图书情报学、心理学、生物化学与分子生物学、机械工程学作为学科样本,从Mendeley指标视角,揭示中美国际学术论文影响力之受众与范围[24];宋玲玲设计构建基于PLoS ALMs的学术论文影响力评价框架,并以航空航天医学为例进行实证研究,发现PLoS ALMs对论文影响力具有积极作用[25];田玥等以PLoS生物医学论文为例,选取Twitter、Mendeley、PMC和Counter4种媒介,分析论文在社交网络中的关注度[26]。
总体而言,基于Altmetrics视角,对机构知识库的研究较多,专门评价分析中美高校生物医学论文的少;相关研究对比不同国家学术论文影响力,对被引量和Altmetrics指标相关性分析的较多,也有学者对PLoS生物医学论文的关注度进行分析,但对不同指标综合分析、对比生物医学论文保存和分享指标差异性的探究较少,尤其缺少对论文可见性与学术影响力的探讨。
2研究框架与方法
2.1样本选取
好的研究样本是总体的缩影,最好的抽样调查结果能反映总体的状况,结论能在总体中推广应用。据AR
WU(Shanghai Ranking’s Academic Ranking of World Universities,软科世界大学学术排名)发布的世界一流学科排行榜,H大学有
13个“状元学科”,生物医学学科就包括生物医学工程、生物工程、临床医学、公共卫生、医学技术等5个学科[27]。P大学是我国“双一流”建设的重点高校,在全国学科评估中,其生物学和基础医学均为A+。因此,本文以PLoS ALMs为研究工具,选取P大学、H大学为中美一流高校的代表,基于论文层面的多个指标,从多维度、新视角分析中美生物医学论文Altmetrics指标的异同,研究论文可见性与学术影响力的关系,并检验中美论文的可见性差异。
2.2数据获取
PLoS旗下有12种开放获取期刊[28],其中PLoS Biology、PLoS Medicine、PLoS Com-putational Biology、PLoS Genetics、PLoS Pathogens、PLoS ONE、PLoS Neglected Tropical Diseases等7本为高水平的生物医学期刊。2009年3月PLOS推出Lagotto[29],收集包括用户的浏览、分享、讨论、引用、推荐等多源数据,实现论文级别计量。笔者对研究数据的获取策略包括:登录网站,在“General Search”界面的“Institution”检索框中依次输入“P University”“H University”,“Publication Date”选择“All time”,结果显示,“P University”的论文1,272篇,“H Uni-versity”的论文1,090篇。按照“选择论文”“预览结果”“查看ALMs报告”3个步骤,获得ALMs数据。数据集包含两部分:一是高校的“AL
Ms Report”,包括论文的Viewed、Saved、Discussed、Cited、Recommended数据,其中Discussed包括在社交网络中的保存和分享(Mendeley、CiteULike和Figshare等)和讨论(Twitter和Facebook等);二是论文的“DOI List”,即论文的“身份信息”。数据获取时间为2018-04-24。
2.3数据处理与清洗
在上述检索时间,H、P两所大学在这些期刊上发文数量分别为6,742篇、1,290篇,根据PLoS平台提供的“Subject Areas”字段,将原始数据进行了生物医学论文(1,090篇,1,272篇)
图1研究框架图
PLoS
ALMs
数据源
获取题录信息
实证分析
相关性分析
差异性分析
描述性统计数据正态分布检验
PLoS Total Mendeley PMC Total Scopus
WoS
Figshare
H University P University 和非生物医学论文(5,652篇,18篇)的区分。从统计学角度讲,ALMs Report 数据相当于从PLoS 出版的所有中美高校生物医学期刊论文中抽取的一个样本,通过该样本来推断总体,发现总体的基本规律和情况。对照ALMs指标的完整性,去除部分不完整数据,整理获得P University 有效数据1,270个,H University 有效数据1,087个。数据统计分析采用IBM SPSS statis-tics 25.0[30],研究框架见图1。由于CrossRef、Wordpress、DataCite、Science Seeker、Reddit、Facebook、Twitter、F1000Prime等指标的非零数据稀疏,均值较小,为兼顾指标的代表性,本文选取PLoS Total、PMC Total、Sco-pus、Mendeley、WoS 和Figshare 等6种指标。Mendeley、Figshare 是论文的在线保存与分享,属于“社交类书签、传播数据”,测度论
文的可见性;Scopus、WoS 属于学术被引,也是论文评价的重要指标[31]。影响力评价通常选用期刊论文,但更广阔的视角是研究高校、机构论文的整体表现和影响。ALMs 捕捉论文多方面的可见性(传播和使用),包括浏览、分享、讨论、引用、推荐等。作为一个完整的数据集,描绘学术体和公众对研究工作参与的整体画卷。
3研究结果
3.1描述性统计
覆盖率是测试数据有效性的一个度量值,用以测评数据的可靠性、稳定性[32]。在本研究中,指标非零值的文献数量占总指标的比例为覆盖率,反映该指标在文献评价中的可利用价值。表1为中美高校论文指标的描述性统计表,指标数值相差较大,如WoS 均值较小,PLoS Total 均值较大。均值和指标覆盖率具有一致性,PLoS Total指标覆盖率均为100%,即论文在PLoS官
网上均被浏览、下载过。其余指标的覆盖率,除Figshare外,均为H大学的论文高于P大学的论文,如PMC Total 指标的覆盖率,H 大学为98.1%,而P大学为97.2%。而Figshare指标的覆
盖率,P大学(85.9%)反超H大学(83.5%)。被引量指标覆盖率均超过70%,说明PLoS Total、PMC Total、Scopus、WoS、Mendeley 和Figshare指标数据可靠,稳定性高,覆盖率最低为P 大学的WoS 引用为73.9%。从指标平均值
看,WoS、Mendeley和Figshare均是H大学高于P 大学,即学术影响力指标和可见性指标,H 大学均高于P大学。因此,选择WoS、Mendeley
统计量平均值中位数标准差方差偏度峰度最小值最大值覆盖率(%)PLoS Total 6,897.6/2,508.23,799.0/1,487.013,553.9/5,943.3183,708,210.4/35,322,677.712.8/13.7250.2/237.052.0/35.0311,861.0/127,754.0100/100PMC Total 944.4/725.9568.0/509.01,658.3/918.62,750,026.8/843,896.712.0/6.0206.8/58.80.0/0.032,403.0/13,360.098.1/97.2Scopus 22.2/9.38.0/4.043.8/24.71,922.2/610.55.8/11.051.3/157.10.0/0.0601.0/442.086.8/76.9Mendeley 58.5/15.436.0/9.082.6/25.16,825.1/629.55.5/8.857.2/132.00.0/0.01,312.0/504.098.8/95.4WoS 21.9/8.17.0/3.043.6/22.61,897.0/511.55.2/11.638.5/177.30.0/0.0518.0/440.086.1/73.9Figshare
99.6/92.864.0/63.0468.6/118.2219,566.5/13,966.730.4/4.0970.1/28.00.0/0.015,102.0/1,511.083.5/85.9
表1H 大学/P 大学论文各指标描述性统计(N1=1,087,N2=1,270)
图2在线保存、分享与学术影响散点矩阵图
H 大学P
大学
和Figshare指标来对中美生物医学论文进行可见性和学术影响力分析是有效的。3.2在线保存、分享与学术影响
散点矩阵图能够比较直观地可视化展示每对变量之间相关性。如图2所示,Mendeley 在线保存和WoS 引用具有较高的相关性,Figshare 在线分享则与WoS引用相关性较低。3.3正态分布检验及相关性分析
根据表1分析各指标的偏度值,发现偏度值均大于零,因此,样本为非正态分布[33],选择斯皮尔曼相关分析[34]。相关系数r 常用来刻画变量之间相关关系的强弱,各指标Spearman相关性结果如表2所示。相关系数分级参照卢冶飞等[35]的方法。从表2中数据可知,使用量、被引量、
保存量、分享量各指标两两间的斯皮尔曼相关系数均为正值,说明各指标间均为正相关。其中,有24个相关系数值在0.01水平上显著相关,3个指标值在0.05水平上显著相关,这说明PLoS 论文使用量、被引量、保存量、分享量各指标间存在正向显著相关。以H大学的论文为例,使用量与其他指标(除Figshare 外)都显著相关,但PLoS Total 与Figshare 仅微弱相关(0<r ≦0.3)。被引量(WoS 被引、Scopus 被引)与其他指标(除Figshare 外)都显著相关,但与Figshare 仅微弱相关。保存量与其他指标都显著相关,但与Figshare仅微弱相关。分享量与其他指标都微弱相关。P大学论文的指标相关性分析结果与H大学类似,说明中美生物医学论文指标间的联系具
有稳定性。Figshare 反映用户收集、保存、分享论文等行为,与其他指标的相关性较低,可能与享有免费存储定量(1GB、不超过100个文件等)数据的权益,超出定量后,需支付费用[36]有关,亦可能与用户的使用习惯
相关。同质化数据共享平台较多,如
Dryad、Edinburgh DataShare 等,也可能分流部分用户。
3.4两个独立样本的非参数检验
两独立样本非参数检验是在对总体分布不了解的情况下,通过对两组独立样本的分析来推断样本所在的两个总体分布是否存在显著性差异。本文选取的两样本相互独立,拟采用Mann-Whitney U 检验(以下简称“M-W U 检验”),基于Mendeley 保存量、Figshare 分享量数据进行检验,从总体比较
表2可见性与学术性指标相关性分析对比表
相关系数H University论文各指标(N=1,087)P University论文各指标(N=1,270)PLoS Total PMC Total
Scopus Mendeley
WoS Figshare
PLoS Total PMC Total
Scopus Mendeley
WoS Figshare
PLoS Total
reddit1.0001.000PMC Total 0.626**1.0000.701**1.000Scopus 0.678**0.678**1.0000.738**0.722**1.000Mendeley 0.803**0.574**0.727**1.0000.764**0.588**
0.647**
1.000
WoS 0.704**0.704**
0.939**
0.750**
1.0000.746**0.723**0.940**0.659**1.000
Figshare 0.090**0.098**0.0420.070*0.0391.0000.113**0.133**0.069*0.060*0.0471.000
注:**在0.01级别(双尾)相关性显著;*在0.05级别(双尾)相关
性显著。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。