python爬⾍爬取图⽚代码_python爬⾍爬取图⽚的简单代码Python是很好的爬⾍⼯具不⽤再说了,它可以满⾜我们爬取⽹络内容的需求,那最简单的爬取⽹络上的图⽚,可以通过很简单的⽅法实现。只需导⼊正则表达式模块,并利⽤spider原理通过使⽤定义函数的⽅法可以轻松的实现爬取图⽚的需求。
1、spider原理
spider就是定义爬取的动作及分析⽹站的地⽅。
以初始的URL**初始化Request**,并设置回调函数。 当该request**下载完毕并返回时,将⽣成**response ,并作为参数传给该回调函数。
2、实现python爬⾍爬取图⽚
第⼀步:导⼊正则表达式模块
import re # 导⼊正则表达式模块
import requests # python HTTP客户端 编写爬⾍和测试服务器经常⽤到的模块
import random # 随机⽣成⼀个数,范围[0,1]
第⼆步:使⽤定义函数的⽅法爬取图⽚
def spiderPic(html, keyword):
print('正在查 ' + keyword + ' 对应的图⽚,下载中,请稍后......')
for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查URL
print('正在爬取URL地址:' + str(addr)[0:30] + '...')
# 爬取的地址长度超过30时,⽤'...'代替后⾯的内容
python新手代码图案如何保存try:
pics = (addr, timeout=100) # 请求URL时间(最⼤10秒)
ptions.ConnectionError:
print('您当前请求的URL地址出现错误')
continue
fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb')
# 下载图⽚,并保存和命名
fq.t)
fq.close()
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论