温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Python爬虫怎么破解滑块验证码

发布时间:2021-08-04 18:12:15 来源:亿速云 阅读:216 作者:chen 栏目:编程语言

这篇文章主要介绍“Python爬虫怎么破解滑块验证码”,在日常操作中,相信很多人在Python爬虫怎么破解滑块验证码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫怎么破解滑块验证码”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

1、启动selenium,获取验证码图片,方便查看预览

from selenium import webdriver import time import base64 from PIL import Image from io import BytesIO from selenium.webdriver.support.ui import WebDriverWait   def checkVeriImage(driver):   # 等待画布加载完毕     WebDriverWait(driver, 5).until(         lambda driver: driver.find_element_by_css_selector('.geetest_canvas_bg.geetest_absolute'))     time.sleep(1)     # 获取有缺口的图片     im_info = driver.execute_script(         'return document.getElementsByClassName("geetest_canvas_bg geetest_absolute")[0].toDataURL("image/png");')     # 得到base64编码的图片信息     im_base64 = im_info.split(',')[1]     # 转为bytes类型     im_bytes = base64.b64decode(im_base64)     with open('./tempbg.png', 'wb') as f:         # 保存图片到本地,方便查看预览         f.write(im_bytes)              image_data = BytesIO(im_bytes)     bgImage = Image.open(image_data)     # 计算offsetx的长度     offsetX = VerifyImageUtil().getVerticalLineOffsetX(bgImage)     # 获取滑块按钮     eleDrag = driver.find_element_by_css_selector(".geetest_slider_button")     action_chains = webdriver.ActionChains(driver)     # 拖动滑块按钮,注意滑块距离左边有 5~10 像素左右误差 action_chains.drag_and_drop_by_offset(eleDrag,offsetX-10,0).perform()

2、修正拖动滑块动作太快的问题。

使用 action_chains.move_by_offset(10,0)

action_chains = webdriver.ActionChains(self.driver) # 点击,准备拖拽 action_chains.click_and_hold(source) action_chains.pause(0.2) action_chains.move_by_offset(targetOffsetX-10,0) action_chains.pause(0.6) action_chains.move_by_offset(10,0) action_chains.pause(0.6) action_chains.release() action_chains.perform()

3、也可以进行拖拽间隔时间和拖拽次数、距离的随机化

 def simulateDragX(self, source, targetOffsetX):         """         模仿人的拖拽动作:快速沿着X轴拖动(存在误差),再暂停,然后修正误差         防止被检测为机器人,出现“图片被怪物吃掉了”等验证失败的情况         :param source:要拖拽的html元素         :param targetOffsetX: 拖拽目标x轴距离         :return: None         """         action_chains = webdriver.ActionChains(self.driver)         # 点击,准备拖拽         action_chains.click_and_hold(source)         # 拖动次数,二到三次         dragCount = random.randint(2, 3)         if dragCount == 2:             # 总误差值             sumOffsetx = random.randint(-15, 15)             action_chains.move_by_offset(targetOffsetX + sumOffsetx, 0)             # 暂停一会             action_chains.pause(self.__getRadomPauseScondes())             # 修正误差,防止被检测为机器人,出现图片被怪物吃掉了等验证失败的情况             action_chains.move_by_offset(-sumOffsetx, 0)         elif dragCount == 3:             # 总误差值             sumOffsetx = random.randint(-15, 15)             action_chains.move_by_offset(targetOffsetX + sumOffsetx, 0)             # 暂停一会             action_chains.pause(self.__getRadomPauseScondes())               # 已修正误差的和             fixedOffsetX = 0             # 第一次修正误差             if sumOffsetx < 0:                 offsetx = random.randint(sumOffsetx, 0)             else:                 offsetx = random.randint(0, sumOffsetx)               fixedOffsetX = fixedOffsetX + offsetx             action_chains.move_by_offset(-offsetx, 0)             action_chains.pause(self.__getRadomPauseScondes())               # 最后一次修正误差             action_chains.move_by_offset(-sumOffsetx + fixedOffsetX, 0)             action_chains.pause(self.__getRadomPauseScondes())           else:             raise Exception("莫不是系统出现了问题?!")           action_chains.release().perform()

到此,关于“Python爬虫怎么破解滑块验证码”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI