文献检索 作业二
班级:食安1002 学号:4102100240spider软件姓名:周杰
一、 什么是加权检索?加权检索与布尔检索有什么不同?
答:1.加权检索
加权检索就是在检索时赋给每个检索词一个表示其重要程度的数值,即所谓的“权值”,在检索过程中,对含有这些检索词的文献进行加权计算,权值之和在规定的数值(称为阀值)之上者才会作为检索结果输出,权值的大小可以反映出被检出文献的切题程度。加权检索目前在信息系统中的应用还不很完善,不是所有的系统都提供这种检索技术,即使能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定也都有不同的技术规范。目前存在词加权检索和词频加权检索2种基本的加权检索方法。
2.布尔逻辑检索
利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。
3.加权检索与布尔检索的不同点
(1)从表面上看,它们所使用的匹配方法不同,在布尔检索中是采用逻辑原理进行匹配,在加权检索中则采用数字或加权符号进行匹配。但是,实际上二者在很大程度上以可以特殊同归,其结果往往极为相近。加权检索和布尔逻辑检索没有质的区别。通过布尔逻辑能实现的检索,也可以通过加权法实现。
(2)布尔检索的结果只有或是或非的二值逻辑,这可以说是布尔检索的一个缺陷,而加权检索可以按照用户的提问要求。对各检索项分别赋予不同的权值,检索时将其结果按权值大小排序输出。因此,有人把布尔检索方法称为定性检索方法,而把加权检索方法称为定量检索方法。
(3)加权检索同布尔检索一样,也是文献检索的一个基本检索手段,但不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。
布尔检索有利于提高查全率,而加权检索有利于提高查准率。
二、元搜索引擎与索引式搜索引擎在结构上有什么不同?
答:1.元搜索引擎
元搜索引擎是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面,帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作。元搜索引擎看成具有双层c/s结构(客户机/服务器结构)的系统。用户向元搜索引擎发出检索请求,元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求,搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。当然,某些元搜索引擎具有略微不同的机制。
下图是元搜索引擎的结构图:
下图是元搜索引擎的结构图:
元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。
元搜索引擎的优点是方便简单快捷,可以同时使用多个搜索引擎。而缺点是没有自己的数据库。
2.索引式搜索引擎
索引式搜索引擎(Robot Search Engine),也被称为机器人搜索引擎或关键词搜索引擎。它实际上是一个WWW网站,与普通网站不同的是,索引型搜索引擎网站的主要资源是它的索引数据库,索引数据库的信息资源以WWW资源为主,还包括地址、FTP、Gopher等资源。索引式搜索引擎主要使用一个叫“网络机器人”(Robot)或 “网络蜘蛛”(Spider)的自动跟踪索引软件,通过自动的方式分析网页的超链接,依靠超链接和HTM
L代码分析获取网页信息内容,并采用自动搜索、自动标引等事先设计好的规则和方式来建立和维护其索引数据库,以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或逻辑组配的检索式,其后台的检索代理软件代替用户在索引数据库中查出与检索提问匹配的记录,并将检索结果反馈给用户。
索引式搜索引擎的结构如下图所示:
3.元搜索引擎和索引式搜索引擎结构的不同
索引式搜索引擎和元搜索引擎的主要区别在于索引式搜索引擎拥有独立的网络资源采集标准机制和相应的数据库,元搜索引擎一般来说没有自己独立的数据库,更多的是提供一联界面(或提供检索方式和结果整理),形成多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体。用户通过元搜索引擎的功能对这个虚拟整体中各独立搜索引擎数据库的查询显示等操作。元搜索引擎中各独立搜索引擎被称为“成员搜索引擎”,他们各自保持其原来的局部数据模式和自己的检索指令。元搜索引擎给出一个全局外部模式,用以接受用户检索输入和结果输出。不过,有的元搜索引擎给出的全局外部模式不完善。
索引式搜索引擎和元搜索引擎的主要区别在于索引式搜索引擎拥有独立的网络资源采集标准机制和相应的数据库,元搜索引擎一般来说没有自己独立的数据库,更多的是提供一联界面(或提供检索方式和结果整理),形成多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体。用户通过元搜索引擎的功能对这个虚拟整体中各独立搜索引擎数据库的查询显示等操作。元搜索引擎中各独立搜索引擎被称为“成员搜索引擎”,他们各自保持其原来的局部数据模式和自己的检索指令。元搜索引擎给出一个全局外部模式,用以接受用户检索输入和结果输出。不过,有的元搜索引擎给出的全局外部模式不完善。
4.代表
搜魅网(someta)作为元搜索引擎的代表之一,集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。
谷歌作为技术含金量最高的索引式搜索引擎,以其先进的技术、全面的检索功能和简单有效的服务,在全球范围内拥有了大量的用户,目前已经发展成为世界范围内规模最大的搜索引擎和最优秀的搜索引擎之一。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论