中国知网与百度学术检索功能比较
收稿日期:2017-09-27
作者简介:刘岱(1966-),女,昆明医科大学图书馆馆员,研究方向:教育、管理及图书情报研究。通讯作者:韦焘。
一、背景
被引频次是由美国科学信息研究所倡导的国际上广泛公认的、以学术论文为载体的研究成果评价体系。具体而言,是学术论文发表以后被引用的次数。目前可以查到中文期刊论文的被引频次的网站或者数据库有中国知网(CNKI )、百度学术、万方数据库、维普数据库等。
有学者曾经在Google Scholar 和CCD (中国引文数据库)中以期刊名为主题词进行精确检索,统计各个期刊在2007—2008两年间所刊载的论文的被引频次。通过统计结果的对比分析,他们认为CNKI 是目前比较理想的中文期刊引文统计工具。在中国大陆,新近出现的百度学术有可能作为一种检索文献的被引频次的重要补充。然而,百度学术与CNKI 所提供的被引频次是否一样?目前还没有这方面的证据,为了提供中国知网与百度学术中文献被引频次是否有差异的信息,拓宽检索工具,笔者以《昆明医科大学学报》的
期刊论文作为研究对象,进行一次尝试。
百度搜索二、研究概况
1.研究对象及内容:以《昆明医科大学学报》2013年发表的论文作为对象,将论文的被引频次作为研究
内容。
2.研究方法:采取随机抽样方法,抽取586篇中200篇期刊论文(34.1%),剔除征稿启事、医院介绍等非学术论文7篇,剩余193篇,在2016年1月1日至10日间分别在中国知网和百度学术查这些论文的被引频次,计算被引频次的均数和标准差,比较两网站数据是否有差异。
3.数据统计和分析方法:采用excel 表格来收集论文的标题、作者、被引频次等信息,录入SPSS19.0。组间被引频次比较使用配对t 检验,以P <0.05作为有统计学意义的标准。
三、结果剔除“征稿启事及医院介绍”等非学术论文信息之后,剩下193篇学术论文。《昆明医科大学学报》2013年发表的学术论文,在中国知网,被引频次为(1.59±2.163),中位数为1[0,2]。百度学术里,被引频次为(1.17±1.602),中位数为1[0,2]。两个网站的被引频次经过配对t 检验,结果显示见表1、2。
《昆明医科大学学报》2013年发表的论文在百度学术、中国知网上被引频次比较:
刘岱,韦焘*
(昆明医科大学图书馆,云南昆明
650500)
摘要:目的:比较中国知网与百度学术中文献被引频次是否相同,为被引频次检索拓展可能的检索工具提供依据。方法:以《昆明医科大学学报》2013年发表的论文作为对象,采取随机抽样方法,抽取586篇中200篇期刊论文(34.1%),剔除稿约、医院介绍等非学术论文7篇,剩下193篇,然后分别在中国知网和百度学术查这些论文的被引频次,作配对t 检验,比较两网站数据是否有差异。结果:193篇论文的平均被引频次分别为1.53±2.14次(中国知网),1.17±1.60次(百度学术),两者差异有统计学意义(P <0.05)。百度学术的被引频次与中国知网的差异不大。结论:与中国知网的被引频次相比,中国知网和百度学术可以共同成为我们文献检索工具。
关键词:中国知网;百度学术;被引频次中图分类号:G642.0
文献标志码:A
文章编号:1674-9324(2018)15-0047-02
———
从文献被引频次角度分析
表1成对样本相关系数
P 值<0.05,说明百度学术被引数与CNKI 被引数之间有显著的相关关系。
表2成对样本检验
Hownet Compared with Academic Search Engine Baidu —From the Perspective of Literature Cited Frequency Analysis
LIU Dai,WEI Tao *
(Kunming Medical University,Kunming,Yunnan 650500,China)
Abstract:Objective:To compare cited frequencies of Chinese academic literature in the Chinese National Knowledge Infrastructure (CNKI)and Baidu Academic,exploring a new tool for retrieval of cited frequencies of academic literature.Method:Included in the study were papers published in "Journ
al of Kunming Medical University"in 2013.Simple random sampling was used to select 200out of 586journal papers (34.1%).Seven non-academic works were excluded on instructions for authors,advertisements for hospitals,etc.The number of the remaining papers was 193.Both CNKI and Baidu Academic were used to search for cited frequencies of these papers.Pairing t testparison and analysis were performed.Results:The cited frequencies of 193academic papers in CNKI and Baidu Academic were 1.53±2.14and 1.17±1.60,respectively.The difference was statistically significant (P <0.05).Baidu's academic citation frequency is not different from that of CNKI.Conclusion:Compared with cited frequencies of Chinese Literature in CNKI and Baidu scholarship can become our literature search tools together.
Key words:CNKI;Baidu Academic;cited frequency
四、讨论
文献的被引频次,是很重要的学术指标。宋丹辉在《对国内三大全文库之检索功能及用户服务的研究》中描述:VIP 、CNKI 、万方三个数据库都支持从引文作者、引文题名和引文刊名三个途径查源文引用的所有文献。不同之处在于:CNKI 的引文检索功能强大,在引文条目中出现的作者、题名、刊名、机构、出版年等任何信息都可以作为检索点。引文以“参考文献”和其他字段处在同一检索界面,通过组
配便可直接获取作者、机构、刊物的自引及他引的情况,这一点是其他两库所不具备的。CNKI 还具有聚类检索功能,提供相关文献的全文链接。CNKI 作为基本引文分析是非常好的工具。
任惠栋在《中文引文检索的分析研究》中指出,无论《中国引文数据库》还是《社会科学引文索引》,基于其收录所限都不能全面反映中文引用情况。此外,用户从不同途径获得文献被引的信息,其结果往往不一致,给查引工作造成了一定的困难。特别是单位查引都是中文数据库只能在来源文献上检索,需分页浏览逐页统计。CNKI 有被引文献的单位入口,然而,只能在CNKI 的收录文献中挖掘,因其收录文献的数量决定了
可统计被引文献的状况。
百度是目前全球最大的中文搜索引擎,每天响应来自全球138个国家数十亿次的搜索请求,覆盖95%以上的中国网民。强大的搜索引擎技术优势不可小视。2014年6月初,百度公司也正式推出了一项免费的学术文献搜索服务———百度学术搜索。
覃燕梅在《百度学术搜索与超星发现系统比较分析及评价》中提到,百度学术声称索引了6亿条元数据,其中期刊论文超过5亿条,会议文献超过3700万条,学位论文超过3000万。
能够检索论文被引频次的数据库,包括中国知网、百度学术、万方数据库、维普数据库等。其中中国知
网的影响力大,因此本文以中国知网的被引频次作为参照,比较百度学术提供的被引频次,探索新的被引频次检索工具。2016年1月的检索结果显示,中国知网论文的被引频次与百度学术的差异不大,中国知网和百度学术可以共同成为我们的文献检索工具。
参考文献:
[1]宋丹辉.对国内三大全文库之检索功能及用户服务的研究[J].大学图书情报学刊,2010,(3):93-96.
[2]覃燕梅.百度学术搜索与超星发现系统比较分析及评价[J].现代情报,2016,36(3):48-52.
P 值<0.05,均值为-0.416,说明百度学术被引数与CNKI 被引数之间显著的差异不大。根据实际的数据可知,百度学术的被引频次与中国知网的差不多。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。