python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】--688IT编程网

python爬⾍源码_Python—爬⾍：王者荣耀全套⽪肤【附源

码】

怎么获取全套⽪肤？⽤钱买，或者⽤爬⾍爬取下来~虽然后者不能穿。这个案例稍微复杂⼀点，但是⼀个⾮常值得学习的项⽬。

具体实现思路：

分析⽹页源代码结构

到合适的⼊⼝

穷举访问并解析

爬取所有英雄所有⽪肤图⽚

代码思路/程序流程：

我分析王者荣耀⽹站上⾯的英雄资料库发现所有英雄的页⾯基本上都是连贯的，并且还是偏向与静态⽹页没有过多的JavaScript渲染，所以⽐较适合来⼀波穷举遍历爬⾍，但是速度也很快。

利⽤python语法字符串操作，列表操作，字典操作等等循环遍历英雄页⾯利⽤python列表切⽚索引和字符串拼接等等⽅法来解析HTML得到⽪肤图⽚链接和背景故事⽂本，将⽪肤图⽚⼆进制⽂件保存为png⾼清⼤图，将所有英雄背景故事合并保存为⽂本⽂档

下⾯是功能以及效果展⽰

图片下载站源码整体展⽰

爬取效果展⽰-丰功伟绩

王者荣耀【⽪肤⾼清⼤图爬⾍】源代码如下

#!/usr/bin/env python

# -*- encoding: utf-8 -*-

import requests

fo = open('./', 'w')

path = './wzry-jpg/'

ls = []

for i in range(105,200):

url = "img/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i) status_code = quest('get', url).status_code

if status_code != 200:

continue

for j in range(1, 9):

imgurl = url[:-5] + '{}.jpg'.format(j)

response = quest('get', imgurl)

if response.status_code != 200:

continue

ls.append(imgurl)

##下载

print("开始下载第{}-{}个英雄⽪肤图⽚>>>".format(i,j), end='')

with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:

f.t)

print('======下载完成======')

for i in range(501,516):

url = "img/images/yxzj/img201606/skin/hero-info/{0}/{0}-bigskin-1.jpg".format(i) status_code = quest('get', url).status_code

if status_code != 200:

continue

for j in range(1, 9):

imgurl = url[:-5] + '{}.jpg'.format(j)

response = quest('get', imgurl)

if response.status_code != 200:

continue

ls.append(imgurl)

##下载

print("开始下载第{}-{}个英雄⽪肤图⽚>>>".format(i,j), end='')

with open(path+str(i)+'-'+str(j)+'.png', 'wb') as f:

f.t)

print('======下载完成======')

##print(ls)

##连接写⼊txt⽂件

for line in ls:

fo.write(line+'n')

fo.close()

688IT编程网

python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式