python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例--688IT编程网

python抓取⽹页图⽚教程_Python实现简单⽹页图⽚抓取完整

代码实例

利⽤python抓取⽹络图⽚的步骤是：

1、根据给定的⽹址获取⽹页源代码

2、利⽤正则表达式把源代码中的图⽚地址过滤出来

3、根据过滤出来的图⽚地址下载⽹络图⽚

以下是⽐较简单的⼀个抓取某⼀个百度贴吧⽹页的图⽚的实现：

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

#抓取⽹页图⽚

#根据给定的⽹址来获取⽹页详细信息，得到的html就是⽹页的源代码

def getHtml(url):

page = urllib.urlopen(url)

html = ad()

return html

def getImg(html):

#利⽤正则表达式把源代码中的图⽚地址过滤出来

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = repile(reg)

imglist = imgre.findall(html) #表⽰在整个⽹页中过滤出所有图⽚的地址，放在imglist中

x = 0

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' %x) #打开imglist中保存的图⽚⽹址，并下载图⽚保存在本地

x = x + 1

html = getHtml("tieba.baidu/p/2460150866")#获取该⽹址⽹页详细信息，得到的html就是⽹页的源代码

getImg(html)#从⽹页源代码中分析并下载保存图⽚

进⼀步对代码进⾏了整理，在本地创建了⼀个“图⽚”⽂件夹来保存图⽚

# -*- coding: utf-8 -*-

# feimengjuan

import re

import urllib

import urllib2

import os

#抓取⽹页图⽚

#根据给定的⽹址来获取⽹页详细信息，得到的html就是⽹页的源代码def getHtml(url):

page = urllib.urlopen(url)

html = ad()

return html

#创建保存图⽚的⽂件夹

def mkdir(path):

path = path.strip()

# 判断路径是否存在

# 存在 True

# 不存在 Flase

isExists = ists(path)

if not isExists:

print u'新建了名字叫做',path,u'的⽂件夹'

# 创建⽬录操作函数

os.makedirs(path)

前端文件上传

return True

else:

# 如果⽬录存在则不创建，并提⽰⽬录已经存在

小米10系列升级miui 14

print u'名为',path,u'的⽂件夹已经创建成功'

return False

# 输⼊⽂件名，保存多张图⽚

def saveImages(imglist,name):

number = 1

for imageURL in imglist:

splitPath = imageURL.split('.')

二码默认版块discuz

fTail = splitPath.pop()

if len(fTail) > 3:

fTail = 'jpg'

fileName = name + "/" + str(number) + "." + fTail

# 对于每张图⽚地址，进⾏保存

try:

u = urllib2.urlopen(imageURL)

data = u.read()

f = open(fileName,'wb+')

f.write(data)

print u'正在保存的⼀张图⽚为',fileName

f.close()

except urllib2.URLError as e:

print (e.reason)

smart原则中s指的是什么?number += 1

#获取⽹页中所有图⽚的地址

def getAllImg(html):

#利⽤正则表达式把源代码中的图⽚地址过滤出来

reg = r'src="(.+?\.jpg)" pic_ext'

imgre = repile(reg)

imglist = imgre.findall(html) #表⽰在整个⽹页中过滤出所有图⽚的地址，放在imglist中

return imglist

#创建本地保存⽂件夹，并下载保存图⽚

html个人网页完整代码图片if __name__ == '__main__':

html = getHtml("tieba.baidu/p/2460150866")#获取该⽹址⽹页详细信息，得到的html就是⽹页的源代码path = u'图⽚'

mkdir(path) #创建本地⽂件夹

imglist = getAllImg(html) #获取图⽚的地址列表

saveImages(imglist,path) # 保存图⽚

结果在“图⽚”⽂件夹下保存了⼏⼗张图⽚，如截图：clinging

总结

以上就是本⽂关于Python实现简单⽹页图⽚抓取完整代码实例的全部内容，希望对⼤家有所帮助。感兴趣的朋友可以继续参阅本站：如有不⾜之处，欢迎留⾔指出。感谢朋友们对本站的⽀持！

688IT编程网

python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

688IT编程网

python抓取网页图片教程_Python实现简单网页图片抓取完整代码实例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法 正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

nginx map用法正则

nginx map用法正则