python爬⾍源码_Python—爬⾍:王者荣耀全套⽪肤【附源
码】
怎么获取全套⽪肤?⽤钱买,或者⽤爬⾍爬取下来~虽然后者不能穿。这个案例稍微复杂⼀点,但是⼀个⾮常值得学习的项⽬。
具体实现思路:
分析⽹页源代码结构
到合适的⼊⼝
穷举访问并解析
爬取所有英雄所有⽪肤图⽚
代码思路/程序流程:
我分析王者荣耀⽹站上⾯的英雄资料库发现所有英雄的页⾯基本上都是连贯的,并且还是偏向与静态⽹页没有过多的JavaScript渲染,所以⽐较适合来⼀波穷举遍历爬⾍,但是速度也很快。
利⽤python语法字符串操作,列表操作,字典操作等等循环遍历英雄页⾯利⽤python列表切⽚索引和字符串拼接等等⽅法来解析HTML得到⽪肤图⽚链接和背景故事⽂本,将⽪肤图⽚⼆进制⽂件保存为png⾼清⼤图,将所有英雄背景故事合并保存为⽂本⽂档
下⾯是功能以及效果展⽰
图片下载站源码整体展⽰
爬取效果展⽰-丰功伟绩
王者荣耀【⽪肤⾼清⼤图爬⾍】源代码如下
#!/usr/bin/env python
# -*- encoding: utf-8 -*-
import requests
fo = open('./', 'w')
path = './wzry-jpg/'
ls = []
for i in range(105,200):
url = "img/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i)    status_code = quest('get', url).status_code
if status_code != 200:
continue
for j in range(1, 9):
imgurl = url[:-5] + '{}.jpg'.format(j)
response = quest('get', imgurl)
if response.status_code != 200:
continue
ls.append(imgurl)
##下载
print("开始下载第{}-{}个英雄⽪肤图⽚>>>".format(i,j), end='')
with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:
f.t)
print('======下载完成======')
for i in range(501,516):
url = "img/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i)    status_code = quest('get', url).status_code
if status_code != 200:
continue
for j in range(1, 9):
imgurl = url[:-5] + '{}.jpg'.format(j)
response = quest('get', imgurl)
if response.status_code != 200:
continue
ls.append(imgurl)
##下载
print("开始下载第{}-{}个英雄⽪肤图⽚>>>".format(i,j), end='')
with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:
f.t)
print('======下载完成======')
##print(ls)
##连接写⼊txt⽂件
for line in ls:
fo.write(line+'n')
fo.close()

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。