selenium滑动验证--688IT编程网

selenium滑动验证

⼀、介绍

现在出现了⼀种通过⽤户⿏标移动滑块来填补有缺⼝图⽚的验证码，我们叫做滑动验证码。它的原理很简单，⾸先⽣成⼀张图⽚，然后随机挖去⼀块，在页⾯展⽰被挖去部分的图⽚，再通过js获取⽤户滑动距离，以及坐标等信息到后台进⾏校验。只要⽤户移动的距离符合，以及移动的轨迹⾏为检测通过即可视为验证通过。

解决思路

⽬前这种验证码的通⽤解决思路如下：

1. 获取验证码图⽚，包含原图以及有缺⼝的图

2. 算出缺⼝的位置，以及滑块要滑动的距离

3. 通过算法模拟⼈⼯移动轨迹selenium xpath定位

4. 通过selenium模拟操作

⼆、逻辑实现

1.获取验证码图⽚

注意我们需要获取两张图⽚，第⼀张是完整背景图，第⼆张是有缺⼝的背景图。

经过分析发现当⿏标位于按钮是上时显⽰完整背景图，当⿏标点击滑动按钮不松，显⽰有缺⼝的背景图。

根据之前学习的爬⾍知识，图⽚⼀定是浏览器下载回来的，通过查看历史请求确实发现了图⽚

但是图⽚有点奇怪，仔细查看发现图⽚是被分块并有意随机拼接的。根据以页⾯的css可以利⽤背景将图⽚拼接出来。我们当然可以依葫芦画瓢的利⽤PIL进⾏图⽚拼接，但是太⿇烦了。

selenium有个⽅法可以对元素进⾏截图，先到图⽚所在的html元素，然后利⽤selenium分别进⾏截图即可获取图⽚。代码如下：

def get_full_image(driver):

"""

⿏标移动到滑块，显⽰完整图案

:param driver: webdriver

:return: 返回验证码背景图⽚Image对象

"""

webdriver.ActionChains(driver).move_to_element(slider).perform()

time.sleep(0.2)

img = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[1]/div[2]/div[1]/a[2]')

if'show'_attribute('class'):

res = img.screenshot_as_png

return Image.open(BytesIO(res))

else:

raise ValueError('获取验证码背景图⽚失败')

完整图⽚

def get_cut_image(driver):

"""

点击滑动按钮获取有缺⼝图⽚

:param driver: webdriver

:return: 返回验证码有缺⼝图⽚的Image对象

"""

slider = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[3]/div[2]')

webdriver.ActionChains(driver).click_and_hold(slider).perform()

time.sleep(0.1)

img = driver.find_element_by_xpath('//*[@id="captcha"]/div/div[1]/div[2]/div[1]/a[1]')

res = img.screenshot_as_png

cut_img = Image.open(BytesIO(res))

return Image.open(BytesIO(res))

有缺⼝图⽚

2.出缺⼝位置，计算移动距离

算法有很多，⼤家可以⾃由发挥。这⾥我们讲⼀种最简单的⽅法。我们要算出的距离是滑块要滑动的距离。

通过⽐较没有缺⼝的图⽚，和这张有缺⼝的图⽚，出滑块的位置和缺⼝的位置即可。经过观察，发现滑块出现的位置固定在x轴的0-100像素范围内，所以循环⽐较两张图⽚的x轴0-100像素范围内的每⼀⾏像素点，直到到第⼀⾏出现两个图⽚像素点颜⾊完全不同的点，即到了滑块的最左边最上的第⼀个像素点。但是在实际操作中发现，虽然⾁眼看起来两张图⽚公共部分⼀模⼀样，但是程序处理后的像素的具体rgb值也是不相同的，所以需要设置⼀个阈值来判断，具体需要进⾏测试。

按照相同的思路，⽐较两张图⽚x轴100-end像素的部分，到缺⼝的最左最上那个点。

⽤到的缺⼝像素点的x坐标减去到的滑块的点的x坐标得到近似移动距离。这种算法，经过测试准确率还不错，⼤家如果在实际⼯作过程中发现有问题，需要根据具体情况去设计不同算法。

代码如下：

def get_distance(full_image, cut_image):

full_pixies = full_image.load()

cut_pixies = cut_image.load()

w, h = full_image.size

full_image.save('full.png')

cut_image.save('cut.png')

# 先最左边不同的点

left = []

for j in range(h):

for i in range(100):

if abs(full_pixies[i, j][0] - cut_pixies[i, j][0]) + abs(full_pixies[i, j][1] - cut_pixies[i, j][1]) + abs(

full_pixies[i, j][2] - cut_pixies[i, j][2]) > 150:

left.append((i, j))

if left:

break

# 再最右边不同的点

right = []

for j in range(h):

for i in range(100, w):

if abs(full_pixies[i, j][0] - cut_pixies[i, j][0]) + abs(full_pixies[i, j][1] - cut_pixies[i, j][1]) + abs(

full_pixies[i, j][2] - cut_pixies[i, j][2]) > 150:

right.append((i, j))

if right:

break

length = right[0][0] - left[0][0]

return length

滑动的距离计算

3.计算滑动轨迹

滑动验证码早期刚⾯世的时候没有做⾏为校验，很快被破解。随着⼈⼯智能的发展，⽬前所有商⽤滑动验证码后台都有做⾏为校验，根据前端传递的移动轨迹，后台会进⾏特征校验，如果判定⾮⼈⼯则返回校验失败。模拟⼈的滑动⾏为，最常见的以中⽅法是通过加速度公式。⽬前这个⽅法已经被识别，但相

对较简单，我们⾸先学习其思路。⼤家根据⾃⼰的能⼒可以⾃⾏扩展。

基本思路是，分析⼿动的移动轨迹后发现，是先加速后减速，所以通过加速度公式进⾏如下的设计：

def get_track(self, distance):

'''

拿到移动轨迹，模仿⼈的滑动⾏为，先匀加速后匀减速

匀变速运动基本公式：

①v=v0+at

②s=v0t+(1/2)at²

③v²-v0²=2as

:param distance: 需要移动的距离

:return: 存放每0.2秒移动的距离

'''

# 初速度

v=0

# 单位时间为0.2s来统计轨迹，轨迹即0.2内的位移

t=0.3

# 位移/轨迹列表，列表内的⼀个元素代表0.2s的位移

tracks=[]

# 当前的位移

current=0

# 到达mid值开始减速

mid=distance * 5/8

distance += 10 # 先滑过⼀点，最后再反着滑动回来

# a = random.randint(1,3)

while current < distance:

if current < mid:

# 加速度越⼩，单位时间的位移越⼩，模拟的轨迹就越多越详细

a = random.randint(1,3) # 加速运动

else:

a = -random.randint(2,4) # 减速运动

# 初速度

v0 = v

# 0.2秒时间内的位移

s = v0*t+0.5*a*(t**2)

# 当前的位置

current += s

# 添加到轨迹列表

tracks.append(round(s))

# 速度已经达到v，该速度作为下次的初速度

v= v0+a*t

# 反着滑动到⼤概准确位置

for i in range(4):

tracks.append(-random.randint(1,3))

# for i in range(4):

# tracks.append(-random.randint(1,3))

random.shuffle(tracks)

return tracks

滑动轨迹

4.滑动滑块

利⽤selenium，根据算出的轨迹，进⾏模拟滑动，代码如下：

def slide(self, tracks):

# slider = self.driver.find_element_by_xpath('//*[@id="captcha"]/div/div[3]/div[2]')

# ⿏标点击并按住不松

# webdriver.ActionChains(self.driver).click_and_hold(self.slider).perform()

# 让⿏标随机往下移动⼀段距离

webdriver.ActionChains(self.driver).move_by_offset(xoffset=0, yoffset=100).perform()

time.sleep(0.15)

for item in tracks:

webdriver.ActionChains(self.driver).move_by_offset(xoffset=item, yoffset=random.randint(-2,2)).perform()

# 稳定⼀秒再松开

time.sleep(1)

webdriver.ActionChains(self.driver).release(self.slider).perform()

time.sleep(1)

# 随机拿开⿏标

webdriver.ActionChains(self.driver).move_by_offset(xoffset=random.randint(200, 300), yoffset=random.randint(200, 300)).perform()

time.sleep(0.2)

info = self.driver.find_element_by_xpath('//*[@id="login-modal"]/div/div/div/div[2]/div[1]/div[2]/div[1]/div/div[1]/div[2]/div[2]/div/div[2]/span[1]') if'验证通过':

return 1

if'验证失败':

return 2

if'再来⼀次':

return 3

if'出现错误':

return 4

滑动滑块

5.完整代码

import re

import time

import random

import requests

from PIL import Image

from selenium import webdriver

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdrivermon.by import By

from io import BytesIO

from selenium.webdrivermon.action_chains import ActionChains

def get_merge_img(img_content,location_list,num):

'''

拼接图⽚

:param img_content:

:param location_list:

:param num:

:return:

'''

im = Image.open(img_content)

im_list_upper = []

im_list_done = []

for location in location_list:

# print(location)

if int(location['y']) == -58:

im_list_upper.p((abs(int(location['x'])),58,abs(int(location['x']))+10,116)))

if int(location['y']) == 0:

im_list_done.p((abs(int(location['x'])),0,abs(int(location['x']))+10,58)))

#create new image

new_im = w('RGB',(260,116))

x_offset=0

for im in im_list_upper:

new_im.paste(im,(x_offset,0))

x_offset +=10

x_offset = 0

for im in im_list_done:

new_im.paste(im, (x_offset, 58))

x_offset += 10

return new_im

def get_img(driver,div_class,num):

'''

获取图⽚

:param driver:

param div_class:

:param num:

:return:

'''

background_imgs = driver.find_elements_by_class_name(div_class)

location_list = []

imge_url = ''

for img in background_imgs:

location = {}

imge_url = re.findall(r'background-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][0] location['x'] = re.findall(r'background-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][1] location['y'] = re.findall(r'backg

round-image: url\(\"(.*?)\"\); background-position: (.*?)px (.*?)px;',_attribute('style'))[0][2]

location_list.append(location)

response = (imge_url).content

img_content = BytesIO(response)

image = get_merge_img(img_content,location_list,num)

image.save('{}.jpg'.format(num))

688IT编程网

selenium滑动验证

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

selenium滑动验证

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式