正则表达式获取a便签内的href链接举例(a标签内容是可变
的)
pattern = repile(r'<a\b[^>]+\bhref="([^"]*)"[^>]*>' + str(link_text) + '.*?</a>')
result = pattern.search(html)
# up(1))
result_url = up(1) #页⾯内的链接
<a\b #匹配a标签的开始
[^>]+ #匹配a标签中href之前的内容
\bhref="([^"]*)" #匹配href的值,并将匹配内容捕获到分组1当中
[^>]*> #匹配a标签中href之后的内容
' + str(link_text) + :正则表达式匹配可变字符串
href标签怎么用</a> #匹配a标签的结束
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论