selenium滑动验证
⼀、介绍
现在出现了⼀种通过⽤户⿏标移动滑块来填补有缺⼝图⽚的验证码,我们叫做滑动验证码。它的原理很简单,⾸先⽣成⼀张图⽚,然后随机挖去⼀块,在页⾯展⽰被挖去部分的图⽚,再通过js获取⽤户滑动距离,以及坐标等信息到后台进⾏校验。只要⽤户移动的距离符合,以及移动的轨迹⾏为检测通过即可视为验证通过。
解决思路
⽬前这种验证码的通⽤解决思路如下:
1. 获取验证码图⽚,包含原图以及有缺⼝的图
2. 算出缺⼝的位置,以及滑块要滑动的距离
3. 通过算法模拟⼈⼯移动轨迹selenium xpath定位
4. 通过selenium模拟操作
⼆、逻辑实现
1.获取验证码图⽚
注意我们需要获取两张图⽚,第⼀张是完整背景图,第⼆张是有缺⼝的背景图。
经过分析发现当⿏标位于按钮是上时显⽰完整背景图,当⿏标点击滑动按钮不松,显⽰有缺⼝的背景图。
根据之前学习的爬⾍知识,图⽚⼀定是浏览器下载回来的,通过查看历史请求确实发现了图⽚
但是图⽚有点奇怪,仔细查看发现图⽚是被分块并有意随机拼接的。根据以页⾯的css可以利⽤背景将图⽚拼接出来。我们当然可以依葫芦画瓢的利⽤PIL进⾏图⽚拼接,但是太⿇烦了。
selenium有个⽅法可以对元素进⾏截图,先到图⽚所在的html元素,然后利⽤selenium分别进⾏截图即可获取图⽚。代码如下:
def get_full_image(driver):
"""
⿏标移动到滑块,显⽰完整图案
:param driver: webdriver
:return: 返回验证码背景图⽚Image对象
"""
webdriver.ActionChains(driver).move_to_element(slider).perform()
time.sleep(0.2)
img = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[1]/div[2]/div[1]/a[2]')
if'show'_attribute('class'):
res = img.screenshot_as_png
return Image.open(BytesIO(res))
else:
raise ValueError('获取验证码背景图⽚失败')
完整图⽚
def get_cut_image(driver):
"""
点击滑动按钮获取有缺⼝图⽚
:param driver: webdriver
:return: 返回验证码有缺⼝图⽚的Image对象
"""
slider = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[3]/div[2]')
webdriver.ActionChains(driver).click_and_hold(slider).perform()
time.sleep(0.1)
img = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[1]/div[2]/div[1]/a[1]')
res = img.screenshot_as_png
cut_img = Image.open(BytesIO(res))
return Image.open(BytesIO(res))
有缺⼝图⽚
2.出缺⼝位置,计算移动距离
算法有很多,⼤家可以⾃由发挥。这⾥我们讲⼀种最简单的⽅法。我们要算出的距离是滑块要滑动的距离。
通过⽐较没有缺⼝的图⽚,和这张有缺⼝的图⽚,出滑块的位置和缺⼝的位置即可。经过观察,发现滑块出现的位置固定在x轴的0-100像素范围内,所以循环⽐较两张图⽚的x轴0-100像素范围内的每⼀⾏像素点,直到到第⼀⾏出现两个图⽚像素点颜⾊完全不同的点,即到了滑块的最左边最上的第⼀个像素点。但是在实际操作中发现,虽然⾁眼看起来两张图⽚公共部分⼀模⼀样,但是程序处理后的像素的具体rgb值也是不相同的,所以需要设置⼀个阈值来判断,具体需要进⾏测试。
按照相同的思路,⽐较两张图⽚x轴100-end像素的部分,到缺⼝的最左最上那个点。
⽤到的缺⼝像素点的x坐标减去到的滑块的点的x坐标得到近似移动距离。这种算法,经过测试准确率还不错,⼤家如果在实际⼯作过程中发现有问题,需要根据具体情况去设计不同算法。
代码如下:
def get_distance(full_image, cut_image):
full_pixies = full_image.load()
cut_pixies = cut_image.load()
w, h = full_image.size
full_image.save('full.png')
cut_image.save('cut.png')
# 先最左边不同的点
left = []
for j in range(h):
for i in range(100):
if abs(full_pixies[i, j][0] - cut_pixies[i, j][0]) + abs(full_pixies[i, j][1] - cut_pixies[i, j][1]) + abs(
full_pixies[i, j][2] - cut_pixies[i, j][2]) > 150:
left.append((i, j))
if left:
break
# 再最右边不同的点
right = []
for j in range(h):
for i in range(100, w):
if abs(full_pixies[i, j][0] - cut_pixies[i, j][0]) + abs(full_pixies[i, j][1] - cut_pixies[i, j][1]) + abs(
full_pixies[i, j][2] - cut_pixies[i, j][2]) > 150:
right.append((i, j))
if right:
break
length = right[0][0] - left[0][0]
return length
滑动的距离计算
3.计算滑动轨迹
滑动验证码早期刚⾯世的时候没有做⾏为校验,很快被破解。随着⼈⼯智能的发展,⽬前所有商⽤滑动验证码后台都有做⾏为校验,根据前端传递的移动轨迹,后台会进⾏特征校验,如果判定⾮⼈⼯则返回校验失败。模拟⼈的滑动⾏为,最常见的以中⽅法是通过加速度公式。⽬前这个⽅法已经被识别,但相
对较简单,我们⾸先学习其思路。⼤家根据⾃⼰的能⼒可以⾃⾏扩展。
基本思路是,分析⼿动的移动轨迹后发现,是先加速后减速,所以通过加速度公式进⾏如下的设计:
def get_track(self, distance):
'''
拿到移动轨迹,模仿⼈的滑动⾏为,先匀加速后匀减速
匀变速运动基本公式:
①v=v0+at
②s=v0t+(1/2)at²
③v²-v0²=2as
:param distance: 需要移动的距离
:return: 存放每0.2秒移动的距离
'''
# 初速度
v=0
# 单位时间为0.2s来统计轨迹,轨迹即0.2内的位移
t=0.3
# 位移/轨迹列表,列表内的⼀个元素代表0.2s的位移
tracks=[]
# 当前的位移
current=0
# 到达mid值开始减速
mid=distance * 5/8
distance += 10  # 先滑过⼀点,最后再反着滑动回来
# a = random.randint(1,3)
while current < distance:
if current < mid:
# 加速度越⼩,单位时间的位移越⼩,模拟的轨迹就越多越详细
a = random.randint(1,3)  # 加速运动
else:
a = -random.randint(2,4) # 减速运动
# 初速度
v0 = v
# 0.2秒时间内的位移
s = v0*t+0.5*a*(t**2)
# 当前的位置
current += s
# 添加到轨迹列表
tracks.append(round(s))
# 速度已经达到v,该速度作为下次的初速度
v= v0+a*t
# 反着滑动到⼤概准确位置
for i in range(4):
tracks.append(-random.randint(1,3))
# for i in range(4):
#    tracks.append(-random.randint(1,3))
random.shuffle(tracks)
return tracks
滑动轨迹
4.滑动滑块
利⽤selenium,根据算出的轨迹,进⾏模拟滑动,代码如下:
def slide(self, tracks):
# slider = self.driver.find_element_by_xpath('//*[@id="captcha"]/div/div[3]/div[2]')
# ⿏标点击并按住不松
# webdriver.ActionChains(self.driver).click_and_hold(self.slider).perform()
# 让⿏标随机往下移动⼀段距离
webdriver.ActionChains(self.driver).move_by_offset(xoffset=0, yoffset=100).perform()
time.sleep(0.15)
for item in tracks:
webdriver.ActionChains(self.driver).move_by_offset(xoffset=item, yoffset=random.randint(-2,2)).perform()
# 稳定⼀秒再松开
time.sleep(1)
webdriver.ActionChains(self.driver).release(self.slider).perform()
time.sleep(1)
# 随机拿开⿏标
webdriver.ActionChains(self.driver).move_by_offset(xoffset=random.randint(200, 300), yoffset=random.randint(200, 300)).perform()
time.sleep(0.2)
info = self.driver.find_element_by_xpath('//*[@id="login-modal"]/div/div/div/div[2]/div[1]/div[2]/div[1]/div/div[1]/div[2]/div[2]/div/div[2]/span[1]') if'验证通过':
return 1
if'验证失败':
return 2
if'再来⼀次':
return 3
if'出现错误':
return 4
滑动滑块
5.完整代码
import re
import time
import random
import requests
from PIL import Image
from  selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from  selenium.webdriver.support import expected_conditions as EC
from  selenium.webdrivermon.by import By
from  io import BytesIO
from selenium.webdrivermon.action_chains import ActionChains
def get_merge_img(img_content,location_list,num):
'''
拼接图⽚
:param img_content:
:param location_list:
:param num:
:return:
'''
im = Image.open(img_content)
im_list_upper = []
im_list_done = []
for  location  in location_list:
# print(location)
if int(location['y']) == -58:
im_list_upper.p((abs(int(location['x'])),58,abs(int(location['x']))+10,116)))
if int(location['y']) == 0:
im_list_done.p((abs(int(location['x'])),0,abs(int(location['x']))+10,58)))
#create new image
new_im = w('RGB',(260,116))
x_offset=0
for im in im_list_upper:
new_im.paste(im,(x_offset,0))
x_offset +=10
x_offset = 0
for im in im_list_done:
new_im.paste(im, (x_offset, 58))
x_offset += 10
return new_im
def get_img(driver,div_class,num):
'''
获取图⽚
:param driver:
:
param div_class:
:param num:
:return:
'''
background_imgs = driver.find_elements_by_class_name(div_class)
location_list = []
imge_url = ''
for img in background_imgs:
location = {}
imge_url = re.findall(r'background-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][0]        location['x'] = re.findall(r'background-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][1]        location['y'] = re.findall(r'backg
round-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][2]
location_list.append(location)
response = (imge_url).content
img_content  = BytesIO(response)
image = get_merge_img(img_content,location_list,num)
image.save('{}.jpg'.format(num))

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。