boyer- moore算法--688IT编程网

boyer- moore算法

Boyer-Moore 字符串搜索算法

Boyer-Moore 算法是一种用于在文本中高效查模式字符串的字符串搜索算法。它是一种启发式算法，这意味着它不保证在所有情况下都能到最优解，但它通常比其他算法快，尤其是在模式字符串很长时。

算法原理

Boyer-Moore 算法基于两个主要原则：

坏字符规则：如果模式字符串中的字符不在文本中，则模式字符串不可能在该文本位置开始。

字符串长度规则好后缀规则：如果模式字符串的后缀与文本中当前位置的后缀匹配，则模式字符串更有可能在该位置开始。

坏字符规则

坏字符规则用于跳过文本中那些不可能开始模式字符串匹配的位置。算法通过创建一个表来实现这一点，该表存储了每个字符在模式字符串中出现的最右位置。如果文本中的字符不在该表中，则算法将文本指针向前移动该字符在模式字符串中出现的距离。

好后缀规则

好后缀规则用于跳过文本中那些不太可能开始模式字符串匹配的位置。算法通过创建一个表来实现这一点，该表存储了模式字符串的所有后缀以及它们与模式字符串本身匹配的距离。如果文本中的后缀不与表中的任何后缀匹配，则算法将文本指针向前移动与该后缀长度相等的距离。

算法步骤

Boyer-Moore 算法的步骤如下：

1. 创建坏字符表。

2. 创建好后缀表。

3. 将模式字符串与文本对齐。

4. 逐个字符向右移动文本指针。

5. 对于每个字符，检查坏字符规则。如果字符不在坏字符表中，则将文本指针向前移动该字符在模式字符串中出现的距离。

6. 如果字符在坏字符表中，则检查好后缀规则。如果文本中的后缀与表中的任何后缀不匹配，则将文本指针向前移动与该后缀长度相等的距离。

7. 如果文本指针到达文本末尾，则模式字符串未在文本中到。

8. 如果模式字符串与文本中的一个字符匹配，则继续比较后续字符。

9. 如果所有字符都匹配，则模式字符串在文本中到。

时间复杂度

Boyer-Moore 算法的时间复杂度通常为 O(m + n)，其中 m 是模式字符串的长度，n 是文本的长度。但是，在某些情况下，算法的时间复杂度可能为 O(mn)。

优势

Boyer-Moore 算法具有以下优势：

它比其他算法快，尤其是在模式字符串很长时。

它只需要预处理模式字符串，不需要预处理文本。

它不需要回溯，因此它在实时应用程序中非常有用。

应用

Boyer-Moore 算法广泛用于各种应用程序中，包括：

文本编辑器和搜索引擎

编译器和解释器

数据库和信息检索系统

模式识别和自然语言处理

688IT编程网

boyer- moore算法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

boyer- moore算法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式