Python +Selenium解决图片验证码登录或注册问题(推荐)
作者:暗潮汹涌 发布时间:2022-12-30 05:41:51
标签:Python,Selenium,验证码,图片验证码
1. 解决思路
首先要获得这张验证码的图片,但是该图片一般都是用的js写的,不能够通过url进行下载。
解决方案:截图然后根据该图片的定位和长高,使用工具进行裁剪
裁剪完毕之后,使用工具解析该图片。
2. 代码实现
2.1 裁剪出验证码图片
裁剪图片需要使用 Pillow 库,进入pip包路径后输入安装命令pip install Pillow:
之前安装的时候忘记了截图,只能够截一张安装后的图片了 ╰(:з╰∠)_
安装完成后,代码实现方式如下:
#coding=utf-8
from selenium import webdriver
import time
from PIL import Image
from selenium.webdriver.support.wait import WebDriverWait
driver = webdriver.Chrome()
# 进入该网站
driver.get("http://www2.nmec.org.cn/wangbao/nme/sp/root/account/signup.html")
# 能否在5s内找到验证码元素,能才继续
if WebDriverWait(driver,5).until(lambda the_driver:the_driver.find_element_by_id("CaptchaImg"), "查找不到该元素"):
# 对于一次截屏无法到截到验证码的情况,需要滚动一段距离,然后验证码的y坐标也应该减去这段距离
scroll = 500
js = "document.documentElement.scrollTop='%s'" %scroll
driver.execute_script(js)
# 截下该网站的图片
driver.get_screenshot_as_file("E:/Python_selenium_advance/Picture/full.png")
# 获得这个图片元素
img_ele = driver.find_element_by_id("CaptchaImg")
# 得到该元素左上角的 x,y 坐标和右下角的 x,y 坐标
left = img_ele.location.get('x')
upper = img_ele.location.get('y') - 500
right = left + img_ele.size.get('width')
lower = upper + img_ele.size.get('height')
# 打开之前的截图
img = Image.open("E:/Python_selenium_advance/Picture/full.png")
# 对截图进行裁剪,裁剪的范围为之前验证的左上角至右下角范围
new_img = img.crop((left, upper, right, lower))
# 裁剪完成之后保存到指定路径
new_img.save("E:/Python_selenium_advance/Picture/croped.png")
time.sleep(2)
driver.quit()
else:
print("找不到验证码元素")
2.2 使用 图鉴 商用接口来识别验证码
接口介绍网址:http://www.ttshitu.com/docs/python.html#pageTitle
调用该接口直接使用网页上的接口文档就行,代码如下:
import json
import requests
import base64
from io import BytesIO
from PIL import Image
from sys import version_info
def base64_api(uname, pwd, softid, img):
img = img.convert('RGB')
buffered = BytesIO()
img.save(buffered, format="JPEG")
if version_info.major >= 3:
b64 = str(base64.b64encode(buffered.getvalue()), encoding='utf-8')
else:
b64 = str(base64.b64encode(buffered.getvalue()))
data = {"username": uname, "password": pwd, "softid": softid, "image": b64}
result = json.loads(requests.post("http://api.ttshitu.com/base64", json=data).text)
if result['success']:
return result["data"]["result"]
else:
return result["message"]
return ""
将其保存为一个单独的 analysis_captcha.py ,然后再导入该方法,直接使用即可:
from analysis_captcha import base64_api
def analysis_captcha(filename):
'''
使用 图鉴 商用接口来识别指定位置的验证码图片
:param filename: 验证码图片位置
:return : 验证码文本
'''
img_path = filename
img = Image.open(img_path)
result = base64_api(uname='kaibin', pwd='******', softid='4545454', img=img)
return result
验证码识别可能会出错,到时候再点击验证码图片换一张,然后重来即可。
总结
以上所述是小编给大家介绍的Python +Selenium实现图片验证码登录或注册问题,希望对大家有所帮助!
来源:https://blog.csdn.net/qq_34659777/article/details/104212376
0
投稿
猜你喜欢
- 我们到目前为止所谈到的SQL语句相对较为简单,如果再能通过标准的recordset循环查询,那么这些语句也能满足一些更复杂的要求。不过,何必
- 本文实例讲述了Python实现方便使用的级联进度信息的方法。分享给大家供大家参考。具体实现方法如下:class StepedProgress
- 本文说明向外扩展数据库系统的两个选项,从而实现更高的可扩展性:水平数据划分和垂直数据划分当我提到向外扩展数据库系统时,我实际上只是讨论对数据
- 前言读写文件是最常见的IO操作。Python内置了读写文件的函数,用法和C是兼容的。读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都
- 本文实例讲述了PHP封装cURL工具类。分享给大家供大家参考,具体如下:CurlUtils工具类:<?php/** * cURL请求工
- 关于Mysql的触发器,基本上每个Mysql教程里都有讲到,但是我发现那些教程里讲的都是如何处理其他表的数据。在Mysql中写触发器操作本表
- Console 对象提供对浏览器控制台的接入(如:Firefox 的 Web Console)。不同浏览器上它的工作方式是不一样的,但这里会
- 本文实例讲述了js控制div弹出层实现方法。分享给大家供大家参考。具体分析如下:这是个功能很好,且容易调用和控制的弹出层。感兴趣的朋友可以调
- 第一种是进行多项式拟合,数学上可以证明,任意函数都可以表示为多项式形式。具体示例如下。###拟合年龄import numpy as npim
- 强大的group by 代码如下:select stdname, isnull(sum( case stdsubject whe
- 到目前为止,我们连接的都是两张不同的表,那么能不能对一张表进行自我连接呢?答案是肯定的。有没有必要对一张表进行自我连接呢?答案也是肯定的。
- Microsoft SQL server2000由一系列相互协作的组件构成。能满足最大的WEB站点和企业数据处理系统存储
- MySQL安装文件已被广泛应用但是也在不断的更新,这里介绍MySQL安装文件设置使用,帮助大家安装更新MySQL安装文件系统。Fedora5
- 这是个郁闷的问题。主级获得ID列表 select ID from FS_SD_Address where PID=0
- 我想大多数的人在编写ASP程序的时候,都碰到过类似的错误信息: Error Num
- 最近基于selenium写了一个python小工具,记录下学习记录,自己运行的环境是Ubuntu 14.04.4, Python 2.7,C
- 最近在D4得到一本(美) Penny Mcintire写的《Visual Design for the Modern Web》.突然觉得可用
- 当1980年Three Rivers公司第一次推出图形用户界面Perq,产生GUI这个概念的时候,不知道他们有没有想过今天图形界面设计竟然会
- 下面这段代码是asp编写的用来识别客户端是否为手机浏览器,以及手机类型的代码。主要用于手机网站的建设,以便实现相同网址下的不同版本网站(比如
- 为了庆祝自己的博客重新开放,我在这里放一个自己刚刚写的jquery日期插件, 也许人们会说:日期选取插件已