学习笔记160—⽂献引⽂分析利器HistCite详细使⽤教程
如果你选修过中国科学技术⼤学⽼师的《⽂献管理与信息分析》,那么你⼀定不会对HistCite 感到陌⽣,这是⼀款⾮常强⼤的引⽂分析⼯具,可以快速绘制出某个研究领域的发展脉络,快速锁定某个研究⽅向的重要⽂献和学术⼤⽜,还可以到某些具有开创性成果的⽆指定关键词的论⽂。
如果说⼀次引⽤表⽰给你的⽂章投⼀票,那么并不是所有票都有效,只有相同领域⽂章的引⽤才能真正体现你在这个领域中的实⼒。所以在 Web of Science (以下简称 WOS)上按照被引次数倒序排列,越靠前不⼀定就越重要。还有⼀种情况,你发明了某种材料,但是后来名字变了,之后的⽂章使⽤的关键词都是新名字,别⼈搜新名字的关键词是搜不到你的开创性⽂章的,但是很显然你的⽂章是⾮常重要的。通过 HistCite 可以直观的看出这个研究领域的论⽂全部引⽤了你的⽂章,可以体现你的⽂章的重要性。
好了,下⾯开始使⽤这个⼯具。⾸先要了解⼀点,HistCite 这款软件是 Thomson Reuters (汤森路透)公司开发的,和 WOS 是⼀家公司,所以 HistCite 只⽀持 WOS 数据库,对于 Scopus 等数据库则⽆能为⼒,不过 Github 上⾯有⼈写了⼀个可以将 Scopus 导⼊ Histcite 进⾏分析的脚本——,有兴趣的同学可以去试试看。
2016年10⽉,汤森路透知识产权与科技业务被 Clarivate Analytics (科睿唯安)公司收购了,从此 WOS 也是归该公司所有,因此导出的数据纯⽂本也发⽣了些许,从⽽不能直接导⼊ HistCite 进⾏分析。不过别
担⼼,HistCite Pro 完全兼容新的⽂件格式!
打开WOS,注意数据库要选择核⼼合集(Core Collection)!
例如简单检索⼀下⽯墨烯在锂离⼦电池负极中的应⽤:
检索结果不是太多,可以全部导出,如果⽂献太多的话,可以先按照被引频次降序排列,只导出前2000篇就差不多了。
下⾯开始导出⽂献信息,点击页⾯上的【保存⾄ Endnote Online】按钮右边的下拉按钮,选择【保存为其他⽂件格式】。
python安装教程非常详细在弹出的菜单中,记录数填写1到500,因为每次最多只能导出500篇⽂献,所以上⾯的2819篇⽂献需要分成6次导出,后⾯导出的时候依次填写501到1000、1001到1500等等。。。记录内容选择【全记录与引⽤的参考⽂献】,⽂件格式选择【纯⽂本】,然后点击发送即可得到导出的 txt ⽂件,类似可以导出其他5个。
注意:含500个记录的txt⽂档⼀般是3M左右,如果你的只有⼏百K,请仔细按照上⾯这张图进⾏导出
下⾯使⽤ HistCite 来分析这6个txt格式的引⽂数据⽂件。由于 HistCite 多年不更新,现在存在各种 Bug,⽐如直接打开 HistCite,⼀加载⽂件就报错:No such file or directory。如果有多个⽂本⽂件,可以重复执⾏导⼊;注意,如果导⼊出现错误,将要导⼊⽂本⽂件开头中的 ”FN Thomson Reuters Web o
f Science“替换成 “FN Thomson Reuters Web of Knowledge" 即可。
尝试第⼆种⽅法。选中所有的 txt ⽂件,然后拖到 HistCite 的图标上,放开⿏标,果然⾃动打开了软件。
但是,事情好像并没有那么简单,⼜出现了⼀个报错:Format Unknown。
在受到这么多折磨之后,我⽤开发了⼀个⽅便使⽤的脚步,于是⼀个以 HistCite 源程序为核⼼的精简易⽤免安装版本问世了,就叫 HistCite Pro 吧。
由于 HistCite 源程序只⽀持 Windows 系统,所以 Pro 版本也只能在 Windows 下使⽤!
你只需要下载 HistCite Pro 的压缩包(下载链接见⽂末)并解压(建议解压到 C 盘或者 D 盘的根⽬录下,保证路径中不含中⽂),就可以直接⽤,不需要安装,同时去掉了很多没⽤的⽂件,⼤⼤缩⼩了软件体积。对于从WOS上导出的txt数据⽂件,不⽤做任何修改,只要把全部的txt放到 TXT ⽂件夹⾥⾯,然后双击 并输⼊数字 1 即可⼀键完成加载,⾮常⽅便。(下⾯是整个操作过程的动图,点击播放)
如果输⼊数字 1 发现没有⾃动打开浏览器窗⼝,或者打开的是⼀个空⽩⽹页,或者可以打开⽹页之后显
⽰的条⽬数为0,⾸先检查⼀下前⾯的导出操作没有错误,然后看⼀下⾃⼰的 IE 浏览器能不能正常打开百度等⽹页,如果 IE 浏览器有故障,可以参考进⾏修复。
如果还不⾏,那就是 HistCite 内核本⾝存在的设计缺陷(毕竟这么多年没有官⽅更新了),在少部分电脑上会出现兼容性问题。所以我采⽤ Python 的多线程成功实现了Advanced 模式,基本可以解决绝⼤部分兼容性问题,即输⼊数字 3。
注意:在该模式下,程序所在路径中的所有⽂件夹和⽂件的命名都不能含有中⽂。
该模式启动之后会⾃动打开两个浏览器窗⼝,先打开默认的 IE 浏览器窗⼝(记为 A 窗⼝),⼀般显⽰
的 Records 数量为 0,然后 5 秒之后会调⽤系统默认浏览器(推荐安装Chrome 浏览器并设置为默认)打开另⼀个窗⼝(记为 B 窗⼝),⼀般在 B 窗⼝就可以正常进⾏数据的导⼊。等导⼊完成之后,你可以将 A 窗⼝关闭,在 B 窗⼝⾥⾯分析数据,或者刷新 A 窗⼝也是可以分析数据的。
好了,数据加载完毕,下⾯开始分析数据吧,点击 Tools 菜单下的 Graph Maker。
在弹出的页⾯上点击 Make Graph 即可得到⼀张引⽂关系图,包含了最有价值的前 30 篇⽂章的完整引⽂关系,这个数字 30 是可以⾃⾏修改的。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。