七、 国内外著名搜索引擎介绍
教学目的
掌握常见搜索引擎的使用方法与技巧
教学内容
1、搜索引擎介绍
1.1搜索引擎发展
十几年前,WWW(World Wide Web,万维网)还没有诞生的时候,互联网上只有冰冷的
文字,没有图像和声音,而且网站数量也不多,感兴趣的网站就那么几个,可以在很短
的时间内就掌握其中的全部信息,搜索引擎完全没有出现的必要。1993年,互联网上出 现了最早的Web浏览器Mosaic,次年Netscape推出了Navigator。浏览器的发展促使
Web得到迅速推广,站点数目以惊人的速度增加,我们再也不能用传统记忆方式来应付
与日俱增的站点。于是,搜索引擎就诞生了。第一个搜索引擎的出生地在美国,它的名
字叫Archie,是由McGill大学的一个小组开发的。
1.2搜索引擎工作原理
利用自动搜寻软件,不断发现与收集各类新网址及网页,利用自动索引软件对网页进行
标引,建立记录的数据库。当用户输入提问关键词之后,以不同的检索方法在其数据库中 出相关的记录,并按相关性顺序排列,将包含此关键词或符合检索条件的所有网址信息和指 向这些网址的链接反馈给用户,从而实现查询目的。简单地说,搜索引擎的原理,可以看作 三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
1.3搜索引擎如何排列Web页面
依据是"位置/频率法"。
1.4搜索引擎词语介绍
简单搜索;词组搜索;语句搜索;目录搜索;高级搜索;
1.5搜索引擎的类型
按搜索引擎获取信息的不同:独立搜索引擎;元搜索引擎;网络搜索软件。
按组织信息的方式:目录搜索引擎;全文搜索引擎;分类全文型搜索引擎;智能搜索引擎。
按服务对象和规模:综合门户搜索引擎;垂直搜索引擎。
2、综合性搜索引擎
在互联网发展的最初阶段,网民在各项活动中的主要浏览对象几乎都是综合性的网站(或称 为门户性网站),所谓综合,指其提供信息与服务的范围广泛,从新闻、讨论组、免费信箱、 下载软件到图片的搜索,不固定在专一知识领域,涉及多种主题内容。
2.1 Google
Google是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年 9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo 公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE 已经获得30多项业界大奖。
GOOGLE基本搜索
Google支持大多数的搜索基本语法规则,比如‘ AND’、 ‘OR’、‘-’,Google无需用 明文的‘AND ’来表示逻辑‘与’操作,只要空格就可以了;Google用减号‘-’表示逻 辑‘非’操作;Google用大写的‘OR’表示逻辑‘或’操作;
·不区分英文字母大小写,所有的字母均当作小写处理;
·Google不支持通配符,如‘*’、‘?’等;
·支持限级技术,可在一个网址前加“site:”表示只搜索某个具体网站,例如要在Google
站点上查新闻,可输入“新闻le”;关键词前加“link:”表示所有指
向该网址的网页,如表所示;
·Google在访问网站时,会将看过的网页复制一份网页快照,以备在不到原来的网页时
网页模板免费网址使用。单击“网页快照”时,将看到Google将该网页编入索引时的页面。
Google高级搜索
Google支持很多高级搜索的语法格式,比如site、link等。
通常,只需在范围较广的查询中添加词语就可以缩小搜索范围。不过,Google 还提供 了很多不同的搜索功能,利用这些功能可以做到:
·将搜索范围限制在某个特定的网站中
·排除某个特定网站的网页
·将搜索限制于某种指定的语言
·查链接到某个指定网页的所有网页
·查与指定网页相关的网页
利用 Google 的高级搜索页可以很轻松地在搜索中应用这些功能。
Google 的特殊功能
类似网页、网页快照、手气不错 、查 Flash 文件、计算器、货币转换 、中英文字 典、错别字改正、天气查询、定义、手机号码、邮编区号、股票查询。
“上面介绍的是一些Google的综合搜索使用方法方面的内容。随着Google的不断发展,
它也逐渐开始提供更多的垂直搜索的功能。比如目录服务、新闻组检索、PDF文档搜索、地
图搜索、电话搜索、图像搜索,还有工具条、搜索结果翻译、搜索结果过滤等更多的功能。” ·分类目录 le/
·工具条 le/
·新闻组 le/
·图像搜索 le/
·搜索结果翻译 le/preferences
·更多搜索内容 le/
3.2百度
百度搜索拥有全球独有的超链分析技术,能在极短的时间内收集到最大数量的互联网信 息。百度搜索引擎目前已经拥有世界上最大的中文信息库,总量达到6000万页以上, 并且还在以每天超过30万页的速度不断增长。与Google类似,有特功能介绍、高级 搜索等。
3.3北大天网
是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北 大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供 服务。与前两者相比较而言,北大天网搜索引擎具有强大的ftp搜索功能。
4、垂直搜索引擎
伴随网站的发展,网民在面对门户网站所提供的海量信息无从选择时,便从对搜索网络 信息数量的要求转向了对信息质量的要求,因而要求有适应的深入化、专业性搜索工具 的出现,在这种背景下,垂直搜索引擎迅速崛起。垂直搜索引擎针对特殊体的需求设 计、提供对特定专业领域的知识搜索查询的工具。其特点就是“专、精、深”,且具有 行业彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具 体和深入。如:面向IT行业的IT罗盘(idnet)、经
济类的证券之星(www.stockstar)、体育类的足球大本营(www.so
ccer888)、论坛搜索(bbs.qikoo/)、生活搜索(www.koo
xoo)、电子商务(www.hengzhe)、旅游搜索(www.qunar)等。 5、检索效果与检索技巧
5.1检索效果及评价
一个理想的信息检索系统,应该是用户需要什么信息,它就能向用户提供什么信息;用
户需要多少信息,它就能提供多少信息,其检索结果不多也不少,而且使用方便、反馈信
息的速度也很快。但是,目前要实现这样的目标还存在许多困难。
不同检索工具和方法,其评价检索标准有一定的差别,以下几项可作为参考:网页覆盖率;
返回结果的准确性;重复信息返回的过滤;网页更新速度;搜索服务的响应时间;搜索服务 的系统稳定性。
实际上,最重要的是查全率、查准率和响应速度。
5.2提高检索技巧与优化检索结果措施
·选择合适的搜索工具
“去信息应该去的的方”,也就是说,查专业性强的东西去优秀的行业网站比搜索引擎强, 搜索专业知识尽量用垂直搜索引擎。
·精确关键词
百度会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要 前提。我们在工作和生活中,会遇到各种各样的疑难问题,比如电脑中毒了,被开水烫伤了 等等。很多问题其实都可以在网上到解决办法。因为某类问题发生的几率是稳定的,而网 络用户有好几千万,于是几千万人中遇到同样问题的人就会很多,其中一部分人会把问题贴 在网络上求助,而另一部分人,可能就会把问题解决办法发布在网络上。有了搜索引擎,我 们就可以把这些信息出来。
这类信息,核心问题是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽 量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中 提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知 道问题的解决办法,我会怎样对此做出回答。也就是说,猜测信息的表达方式,然后根据
这种表达方式,取其中的特征关键词,从而达到搜索目的。
·选用高级搜索
主要体现在检索技术应用、检索条件限定(包括对检索结果的时间、数量、排列次序、域
名、文件类型、显示程度等信息的设置)、检索结果的处理三方面来体现其高级检索的特点。 ·特殊搜
索命令
如利用“title:”表示标题搜索;“site:”表示在某个特定的站点中进行搜索;“phonebook:”
表示查询电话等。对用户来说,要先学习,再使用,并且这种搜索命令不能为深入检索使用, 但若能将此特殊命令熟练掌握一两种,再配合其他检索技巧一起使用,将会非常有效。
·学习搜索、不断总结
总之,熟而后才能生巧。
教学重点、难点
GOOGLE、百度搜索引擎的使用方法与检索技巧
课堂作业
了解的google的发展历史,能熟练使用Google搜索:网页快照、手气不错、类似网页、
计算器、错别字改正、中英文字典、货币转换、天气查询、邮编区号、手机号码、定义
查询等;
熟悉百度搜索:百度快照、相关搜索、拼音提示、错别字提示、天气查询、英汉互译、 计算器度量衡转换、专业文档搜索等。
思考:
1、Google搜索虽然号称“无所不知”,但事实上Google根本无法做到这一点。对以上这句
话你是怎么理解的?
2、在某种程度上,搜索引擎决定了一个网站的生存状态以及是否有存在的必要。对以上这
句话你是怎么理解的?
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论