首页教程专区正文内容

Python提取网页中超链接的方法

教程专区

2025-02-02 14:55:08

正则希望帮助

Python提取⽹页中超链接的⽅法

下⾯是最简单的实现⽅法，先将⽬标⽹页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2

import re

url = 'www.sunbloger/'

req = urllib2.Request(url)

con = urllib2.urlopen(req)

doc = ad()

con.close()

links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)

正则匹配超链接

for a in links:

print a

总结

以上就是这篇⽂章的全部内容，希望本⽂的内容对⼤家的学习或者⼯作能有所帮助，如果有疑问⼤家可以留⾔交流。

版权声明：本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198，我们将在24小时内删除。

PHP正则表达式提取超链接及其标题

« 上一篇

url链接正则

下一篇 »

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法
2025-01-07
正则匹配c语言中8进制
2025-01-07
fortran数据格式
2025-01-07
python中文本转数字用的公式
2025-01-07
gh 文本变数值
2025-01-07
js判断输入是否为正整数、浮点数等数字的函数代码
2025-01-07
qt浮点数正则表达式
2025-01-07
QT正则表达式限制输入值
2025-01-07
手机号码和电话号码的正则表达式
2025-01-07
str转浮点-概述说明以及解释
2025-01-07
英豪结尾的诗句
2025-01-07
Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果
2025-01-07
machinebuilder使用手册
2025-01-07
ASP.NET网站建设基本常用代码
2025-01-07
LCD显示实时时钟
2025-01-07
经纬度正则表达式解析
2025-01-07
前端科学计数法转数字
2025-01-07
python正则表达式re之compile函数解析
2025-01-07
pythonunittest之断言及示例
2025-01-07
[lua]lua中匹配字符串小数
2025-01-07

最新文章

标签列表