搜索引擎的⼯作过程
搜索引擎的⼯作过程分为五个步骤.
第⼀步:搜索引擎的程序(蜘蛛)对⽹站链接进⾏爬⾏到相应的⽹站的页⾯。在我们的链接中不能出现死链接(错误页⾯),要让蜘蛛能很顺利的爬⾏到该⽹页进⾏抓取。蜘蛛抓取页⾯分为深度抓取和宽(⼴)度抓取,分别为⼀个链接到另⼀个链接直到全部抓取完和同⼀个页⾯的所有链接抓取完再到下⼀个页⾯的所有链接抓取。
第⼆步:蜘蛛在抓取完了所有的⽹页页⾯内容后,将所有信息全部储存在百度搜索引擎的原始数据库中抓取⼀些⽂字内容(不包括图⽚、视频)进⾏下⼀步处理分析。
第三步:搜索引擎对⽹页的所有页⾯进⾏会进⾏⼀个⽹页预处理:⽂字提取和⽂字重组,然后将重复的内容进⾏处理(原始数据库中存在的内容) 、去掉停⽌词(的、得、地、哈等等)、消除噪⾳(⼴告提⽰⾳等)。
第四步:搜索引擎把上⾯所有的步骤都完成后,把⽹页的关键词内容匹配度⾼的,反向链接多导出链接少的页⾯进⾏排序索引。(⼀般新⽹站索引的过程中搜索引擎有⼀个⽉左右的观察期来决定是否把⽹站放出来)。
百度搜索第五步:搜索引擎对关键词的处理和⽹页内容的匹配有⼀个计算和调整排名显⽰等最后完成搜索引擎的排名。
最后告诉⼤家:匹配度⾼的,⽹页流量⼤的,权重⾼的⽹站百度搜索引擎会优先展⽰。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论