2020年
软      件 2020, V ol. 41, No. 1
基金项目: 江苏省高校自然科学研究项目(批准号:19KJB520039);江苏省高校哲学社会科学研究项目(批准号:2019SJA2056)
作者简介: 杜兰(1986–),女,副教授,主要研究方向:人工智能、区块链;刘智(1986–),女,工程师,主要研究方向:人工智能;陈琳琳(1981–),女,讲师,主要研究方向:模式识别与人工智能。
基于Python 的文献检索系统设计与实现
杜  兰1,刘  智2,陈琳琳1
(1. 南京理工大学紫金学院,江苏 南京  210023;2. 南京电子技术研究所,江苏 南京  210039)
摘  要: 毕业设计是大学本科教育的一个重要教学活动,既能检验本科阶段学习成果,又能提升实践创新能力。而毕业设计需要学生掌握所毕业课题的学术动态,这要求学生能正确有效地进行文献检索,获取最新发表的文献资料。现如今,大多数学生采用的是手工操作的方式。而海量数据带来的“信息过载”问题,增长了用户检索时间,降低了查准率,严重影响效率。因此,为了帮助学生在浩瀚的文献库里到满足自己专业化、个性化需求的资料,本文系统首先利用Python 爬虫获取文献,实现自动化文献检索和下载。然后基于协同过滤推荐算法,实现基于检索的个性化推荐。该系统能为学生提供准确高效的文献检索服务,提升学生毕业设计质量,是一项值得推广的技术。
关键词: 文献检索;爬虫;毕业设计;推荐
中图分类号: TP391. 41    文献标识码: A    DOI :10.3969/j.issn.1003-6970.2020.01.012
本文著录格式:杜兰,刘智,陈琳琳. 基于Python 的文献检索系统设计与实现[J]. 软件,2020,41(01):55 59
Design and Implementation of Thesis Retrieval System Based on Python
DU Lan 1, LIU Zhi 2, CHEN Lin-lin 1
(1. Nanjing University of Science and Technology ZiJin College, Nanjing 210023, China ;
2. Nanjing Research Institute of Electronics Technology, Nanjing 210039, China )
【Abstract 】: Graduation design is an important teaching activity in undergraduate education. It can not only test the results of undergraduate study, but also improve the ability of practice and innovation. Graduation design requires students to master the academic dynamics of their graduation projects, which requires students to correctly and ef-fectively retrieve documents and obtain the latest published documents. Nowadays, most students use manual opera-tion. However, the problem of "information overload" caused by massive data increases the retrieval time of users, reduces the accuracy rate, and seriously affects the efficiency. Therefore, in order to help students find information to meet their professional and personalized needs in the vast literature library. Firstly, the system uses Python crawler to obtain documents and realize automatic document retrieval and download. Then, based on collaborative filtering recommendation algorithm, personalized recommendation based on retrieval is realized. The system can provide accurate and efficient literature retrieval service for students and improve the quality of graduation design. It is a technology worth promoting.
【Key words 】: Thesis retrieval; Crawler; Graduation design; Recommendation
0  引言
众所周知,文献检索是大学生毕业设计过程中
不可或缺的研究手段。它能让学生在前人的成果上
到起点,激发潜能,拓宽思路,培养创新能力。
现如今,随着图书馆数字化进程的发展,现在学生
普遍采用的是通过联机检索方式来检索并下载文
献。当前检索方式存在如下问题:第一,目前主要
python 爬虫教学
的检索关键字是题名、责任者、关键词等,检索到文献后,还需要再次点击链接进入到详细页面才能下载全文,费时费力。第二,在大数据时代,学术资源急速增长,例如知网(CNKI )上已经高达亿万条记录。而学生本身对相关领域的词汇量储备少,这会导致学生在检索时缺乏检索词,加大检索难度。第三,文献领域多样性会导致用户搜到大量无用信息,浪费大量时间,到最后还是搜不到需要的文献。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。