python自动化实现登录获取图片验证码功能
作者:一枚铜硬币 发布时间:2022-09-21 13:23:59
标签:python,登录,验证码
主要记录一下:图片验证码
1.获取登录界面的图片
2.获取验证码位置
3.在登录页面截取验证码保存
4.调用百度api识别(目前准确率较高的识别图片api)
本次登录的系统页面,可以看到图片验证码的位置
from selenium import webdriver
import time
from PIL import Image
base_url = '***********'
browser = webdriver.Chrome()
browser.maximize_window()
browser.implicitly_wait(10)
browser.get(base_url)
# (1)登录页面截图
browser.save_screenshot("D:/pic.png")#可以修改保存地址
# (2)基操
browser.find_element_by_name("username").send_keys("gxx")
browser.find_element_by_name("password").send_keys("123456")
time.sleep(2)
# (3)获取图片验证码坐标
code_ele = browser.find_element_by_xpath("//*[@id='app']/div/div[1]/form/div[3]/div/div/div[2]/div/img")
print("验证码的坐标为:", code_element.location)#控制台查看{'x': 1086, 'y': 368}
print("验证码的大小为:", code_element.size)# 图片大小{'height': 40, 'width': 110}
# (4)图片4个点的坐标位置
left = code_ele.location['x']#x点的坐标
top = code_ele.location['y']#y点的坐标
right = code_ele.size['width']+left#上面右边点的坐标
down = code_ele.size['height']+top#下面右边点的坐标
image = Image.open('D:/pic.png')
# (4)将图片验证码截取
code_image = image.crop((left, top, right, height))
code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件
上面我们已经把图片保存到本地
这就是我们截取的验证码
接下来要调用 百度ocr识别
链接: https://ai.baidu.com/docs#/
然后可以选择通用文字识别或者 高精度版本,这个 看个人选择,不过验证码识别还是选择高精度 版本(也不一定识别的出来 大家还是佛吧,测试的时候让开发把验证码去掉嘻嘻)
自己去申请一个百度云账号,然后开通文字识别服务…就酱
新建一个py文件
#百度ocr提供了模板,我们直接复制就ok
#下载通用文字识别的python sdk,一定要放在你写的代码的文件夹下面
from aip import AipOcr
from os import path
def baiduOCR(picfile,outfile):#picfile:图片文件名 outfile:输出文件
filename = path.basename(picfile)#图片名称
#百度提供
""" 你的 APPID AK SK """
APP_ID = ''#这是你产品服务的appid
API_KEY = ''#这是你产品服务的appkey
SECRET_KEY = ''#这是你产品服务的secretkey
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
i = open(picfile, 'rb')
img = i.read()
print("正在识别图片:\t" + filename)
""" 调用通用文字识别(高精度版) """
message = client.basicAccurate(img)
print("识别成功!")
i.close()
with open(outfile, 'a+') as fo:#这边是写进.txt文件
fo.writelines("*" * 60 + '\n')#搞点花里胡哨的做区分
fo.writelines("识别图片:\t" + filename + "\n" * 2)
fo.writelines("文本内容:\n")
# 输出文本内容
for text in message.get('words_result'):#识别的内容
fo.writelines(text.get('words') + '\n')
fo.writelines('\n' * 2)
print("文本导出成功!")
print()
if __name__ == '__main__' :
outfile = 'D:/export1.txt'#保存的文件
baiduOCR('D:/pic1.png', outfile)
print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)
这样就识别出来 了,这个能识别正确我也是惊讶了
毕竟之前好多次都 识别的不准确
好!这样 验证码就识别出来 惹,然后把识别的内容输进框子里,点击登录就ok
总结
以上所述是小编给大家介绍的python自动化实现登录获取图片验证码功能网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
来源:https://blog.csdn.net/weixin_42166092/article/details/103135605
0
投稿
猜你喜欢
- 泰勒展开与e的求法大家伙儿知道计算机里的 e是怎么求出来的吗?这还要从神奇的泰勒展开讲起……简单
- 使用math.modf()对一个浮点数进行拆分时经常会遇到如下情况如下import mathprint(math.modf(2.4)) #
- 匹配中文字符的正则表达式: [\u4e00-\u9fa5]匹配双字节字符(包括汉字在内):[^\x00-\xff]应用:计算字符串的长度(一
- MySQL中常用到判断符号,而不等于是比较常用的符号,下面讲解以下三种不等于符号符号意义<>不等于的最早用法,可移植性优于下面两
- 我们首先以一个例子来介绍模块化编程的应用场景,有这样一个名为requirements.py的python3文件,其中两个函数的作用是分别以不
- 高性能异步爬虫目的:在爬虫中使用异步实现高性能的数据爬取操作异步爬虫的方式:- 多线程、多进程(不建议):好处:可以为相关阻塞的操作单独开启
- 本文实例讲述了mysql变量用法。分享给大家供大家参考,具体如下:本文内容:系统变量用户变量局部变量首发日期:2018-04-18系统变量:
- 代码案例import pluggy# HookspecMarker 和 HookimplMarker 实质上是一个装饰器带参数的装饰器类,作
- 开发环境Python 3.8Pycharm模块使用requests >>> pip install requestspar
- 记录遇到的问题;在aliyun上安装MySQL时由于上次错误卸载mysql 导致校验文件出问题;处理方式有几种1到mysql官网下载校验文件
- 简介Puppeteer是Google开发并开源的一款工具,可用代码驱动浏览器操作。由于诸多优秀的特性,Puppeteer常被用在爬虫与自动化
- // 涉及命名空间 using System; using System.Collections; using System.Compone
- 1、安装scikit-learn1.1Scikit-learn 依赖Python (>= 2.6 or >= 3.3),NumP
- requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。可以说,Requests 完全满足如
- 最近自己很关注文档的撰写,包括如何制作PPT。因为发现自己在表达想法和观点的时候,从自己的语言到文字都异常的欠缺。常常需要“高人”帮忙翻译。
- 1.如何在网页中插入空格 我们在用Dreamweaver的所见即所得编辑模式下编辑中文网页时,往往需要
- MySQL安装分为安装版和解压版,安装版主要是由一个exe程序式安装,有界面鼠标点击安装即可,小白建议使用安装版安装mysql,相比较与安装
- 问题:编写一个在1,2,…,9(顺序不能变)数字之间插入+或-或什么都不插入,使得计算结果总是100的程序,并输出所有的可能性。例如:1 +
- 连接数据库等基础操作请自行解决哈,本篇是重点记录如何改密码。一、查询用户密码:查询用户密码命令:select host, user, aut
- 本文实例讲述了python类和对象用法。分享给大家供大家参考,具体如下:前面我们都是用python面向过程编程,现在来用python创建类和