搜索引擎分词方法四法则
搜索引擎的分词法,一直以来都是中的重要分析点,中文分词技术在长尾关键词和文章这两块显得尤为重要。搜索引擎按照 一定的规则,将一个长尾分割成几个部分,融入到内容中,让用户能到想要的内容。
最常见的搜索引擎分词法有三种,广州网站推广公司小编在这里阐述一下:
第一、字符串匹配法:
字符串匹配分词一般为3种:1,正向最大匹配法;2,逆向最大匹配法;3,最少切分。
第二、理解分词法:
中文分词中强调一点:依照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配”,长尾词在文章中的间距也是决定文章排名的因素。如:喜欢玩宠物连连看”百度第十三页的时候已经被分词成”喜欢,玩,宠物,连连,看”全字匹配得到词的权重会高于分开的词的权重根据自己的观察现在百度大部分都是使用的正向匹配百度分词对于一句话分词之后,还会去掉句子中的没有意义的词语。
第三、统计分词法:
字符串匹配方法:百度中搜索“喜欢玩宠物连连看”而在百度排名第一位的以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页这样文章标题中的长尾是排名中非常重要的而在百度第二页。”喜欢玩宠物连连看”用百度快照查看,很显然长尾词已经被分成”喜欢,玩,宠物连。”连看”而在外后已经被分成:喜欢玩,宠物,连连看”这种匹配方法是最少切分方式。
第四、理解分词法:
当输入的字符串中包含≤3个中文字符的话百度分词就会直接接到数据库索引词汇;而当字符串长度》4个中文字符的时候,百度中分词会会把这个词分成若干个字符。如:百度搜索”电dongche”统计分词方法:相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词例如在百度中输入一个字符。“网”而在下面百度也把“网站”标红了这样可以看得出”网”与”站”这两个字符相邻出现的次数非常多,统计分词已经把”网站”纳入了词库。
搜索引擎分词法是百度关键词排名的一个重要的数据,在网站优化推广工作的文章策划前应该先做好这一分析,合理安排。
广州网站优化:www.seowbn
广州网站推广公司:www.jc263
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论