Python中的字符串查操作⽅法总结
基本的字符串位置查⽅法
Python 查字符串使⽤变量.find("要查的内容"[,开始位置,结束位置]),开始位置和结束位置,表⽰要查的范围,为空则表⽰查所有。查到后会返回位置,位置从0开始算,如果每到则返回-1。
str = 'a,hello'
print str.find('hello') # 在字符串str⾥查字符串hello
>> 2    # 输出结果
朴素匹配算法
朴素匹配算法是对⽬标字符串和模板字符串的⼀⼀匹配。如果匹配得上,下标向右移⼀位, 否则清空并重新开始匹配。
target = 'abb aba'
pattern = 'aba'
查匹配的字符串函数def match(target, pattern):
i = j = 0
n, m = len(target), len(pattern)
while i < n and j < m:
# 如果字符相等则⽬标和模板的下标都向右移
if target[i] == pattern[j]:
i, j = i+1, j+1
else:
# 如果字符不相等则⽬标下标切换到不相等的下标
# 模板下标移动到初始下标
i = i - j + 1
j = 0
if j == m:
return i - j
return -1
把上⾯的加上print后打印⼀遍
#修改的地⽅
else:
i = i -j + 1
j = 0
print(target[i], pattern[j], i, j)
# 打印结果
b a 1 0
b a 2 0
a 3 0
a a 4 0
循环会⼀直到相等的匹配值, 这个⽅法效率低下,主要是在不匹配时会重新把模板字符循环⼀次。最多可能会出现 m * (n-m +1)次。m是模板字符的长度,n-m + 1是排除不等字符的次数。
KMP 算法
kmp是通过已知匹配的字符进⾏移位的算法,⽐如上⾯的abb 中跟abc⽐较的话 ab是已知的。
def match(target, pattern):
i = j = 0
n, m = len(target), len(pattern)
while i < n and j < m:
# 如果字符相等则⽬标和模板的下标都向右移
if if j == -1 and target[i] == pattern[j]:
i, j = i+1, j+1
else:
# 这⾥通过next 函数来判断位移个数
i = i - j + pattern_next(pattern[:j])
j = 0
if j == m:
return i - j
return -1
def pattern_next(s):
prefix = [s[:i+1] for i in range(len(s)-1)]  suffix = [s[i+1:] for i in range(len(s)-1)]  l = list(set(prefix) & set(suffix))
return len(l)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。