正则之利⽤元素属性进⾏匹配当爬⾍或者数据清洗时,会遇到知道id、class以及name属性
来匹配信息,获取数据的时候。
以下即可,⾃⼰⾃⾏替换属性以及添加url最后改成符合⾃⼰
需求的匹配模板和匹配对象即可。需要注意的⼀点是,记得查看匹配对象的类型。
正则匹配超链接html = (url).text
html = BeautifulSoup(html,"html.parser")
# print(html)
imgUrls = html.findAll('div', class_="slide-bigpic")
# print(type(imgUrls))查看对象的类型,只有字符串可以
imgList =[]
for imgUrl in imgUrls:
imgUrl = str(imgUrl)
res = repile(r'data-ks-lazyload="(.*?)"',re.S|re.M)
img = re.findall(res,imgUrl)
imgList.append(img[0])print(imgList)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论