Python调用易语言动态链接库实现验证码功能
作者:python可乐编程 发布时间:2023-08-08 14:31:28
标签:Python,易语言,验证码,动态链接库
今天成功把易语言调用验证码通杀的DLL在Python中成功调用了
特此共享出来,下面是识别截图:
识别方法1:
"""当然在学习Python的道路上肯定会困难,没有好的学习资料,怎么去学习呢? 学习Python中有不明白推荐加入交流群号:928946953 群里有志同道合的小伙伴,互帮互助, 群里有不错的视频学习教程和PDF!还有大牛解答!"""
# 来源:http://www.sanye.cx/?id=12022
# 优点:载入快、识别速度高、识别精度较高
# 缺点:仅在32位Python环境中成功运行
# 获取上级目录
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 获取验证码文件夹
img_list = os.listdir(path + r"\captcha")
# 载入识别库
dll = cdll.LoadLibrary(path + r"\ocr1\ocr.dll")
# 初始化识别库
dll.init()
# 遍历图片并识别
for i in img_list:
# 读入图片
with open(path + r"\captcha\{0}".format(i), "rb") as file:
# 读入图片
image = file.read()
# 利用dll中的ocr函数进行识别
Str = dll.ocr(image, len(image))
# 返回的是指针,所以此处将指针转换为字符串,然后再编码即可得到字符串类型
text = string_at(Str).decode("utf-8")
print(f"识别返回:{text},类型:{type(text)},ID地址:{id(text)}")
识别方法2:
# 来源:[url=https://www.52pojie.cn/thread-1072587-1-1.html]https://www.52pojie.cn/thread-1072587-1-1.html[/url]
# 优点:识别速度高、识别精度高
# 缺点:仅在32位Python环境中成功运行、载入时间较长
# 获取上级目录
path = os.path.abspath(os.path.dirname(os.getcwd()))
# 载入识别库
dll = cdll.LoadLibrary(path + r"\ocr2\OCRS.dll")
# 载入字库与建立字库索引
with open(path + r"\ocr2\通杀英文数字库.cnn", "rb") as file:
# 载入字库
word_bank = file.read()
# 建立字库索引
work_index = dll.INIT(path, word_bank, len(word_bank), -1, 1)
# 读入待识别图片列表
img_list = os.listdir(path + "\captcha")
# 循环识别图片并输出
for i in img_list:
# 打开指定图片
with open(path + "\captcha\{0}".format(i), "rb") as file_img:
# 读入图片
image = file_img.read()
Str = create_string_buffer(100) # 创建文本缓冲区
dll.OCR(work_index, image, len(image), Str) # 利用DLL中的识别函数进行识别
text = Str.raw.decode("utf-8") # 对识别的返回值进行编码
print(f"识别返回:{text},类型:{type(text)},ID地址:{id(text)}")
1.自己弄了一个类,下载下来直接使用,调用方法:
dll = Ver_code_1(DLL文件所在的文件夹目录)
#或者
dll = Ver_code_2(DLL文件所在的文件夹目录)
#识别图片:
dll.ocr(图片)
2.修正了识别库2空白字符未消除,无法正确判断长度的问题(可以利用固定长度判断是否符合,进行初步筛选,避免提交后网页返回验证码错误)
import os
from ctypes import *
class Ver_code_1:
# 启动时需要传入ocr.dll
def __init__(self, path):
# 载入识别库
self.dll = cdll.LoadLibrary(path + r"\ocr.dll")
# 初始化识别库
self.dll.init()
def ocr(self, image):
Str = self.dll.ocr(image, len(image))
# 返回的是指针,所以此处将指针转换为字符串,然后再编码即可得到字符串类型
return string_at(Str).decode("utf-8")
class Ver_code_2:
def __init__(self, path):
# 载入识别库
self.dll = cdll.LoadLibrary(path + r"\OCRS.dll")
# 载入字库与建立字库索引
with open(path + r"\通杀英文数字库.cnn", "rb") as file:
# 载入字库
self.word_bank = file.read()
# 建立字库索引
self.word_index = self.dll.INIT(path, self.word_bank, len(self.word_bank), -1, 1)
def ocr(self, image):
Str = create_string_buffer(100) # 创建文本缓冲区
self.dll.OCR(self.word_index, image, len(image), Str) # 利用DLL中的识别函数进行识别
return Str.raw.decode("utf-8").rstrip('\x00') # 对识别的返回值进行编码后返回,这里的\x00是删除缓冲区的空白符
注意!测试环境为:
Python 3.9.2 (tags/v3.9.2:1a79785, Feb 19 2021, 13:30:23) [MSC v.1928 32 bit (Intel)] on win32
经测试,无法在64位环境下调用,如有大佬能实现,烦请告知一下
关于DLL改64位的思路:
我找到了论坛中的IDA pro,成功将DLL进行了反编译,如图:
其实最关键的就是以上的init以及ocr两个函数,但是后续如何将IDA pro项目转换为64位,然后进行编译,目前没有找到合适的方法,如果有大佬麻烦告知一下。
来源:https://www.cnblogs.com/pythonQqun200160592/p/15152466.html


猜你喜欢
- 前言:为什么要写这篇文章,因为前段时间有一个开源的github中的项目有一个朋友提交了一个pr看了下是帮忙优化了下代码(十分感谢这位网友)。
- 1. 如何阻止事件冒泡 //非IE if (event && event.stopPropagation) event.st
- 本文实例讲述了Python实现的文本简单可逆加密算法。分享给大家供大家参考,具体如下:其实很简单,就是把一段文本每个字符都通过某种方式改变(
- 楔子在 Python3.6 之前,格式化字符串一般会使用百分号占位符或者 format 函数,举个例子:name = &
- 一、传入的参数类型要求不同:1、 file.write(str)需要传入一个字符串做为参数,否则会报错。write( "字符串&q
- 1、字典的概念Python中的字典数据类型和现实中的字典很像,它是以键值对(键和值的组合)的方式把数据组织到一起,可以通过键找到与之对应的值
- 使用WSH调用系统的Ping命令,将Ping的结果重定向到一个文本文件中去,再把文本文件显示到网页中具体做法如下:首先, 建一个.BAT文件
- 我们知道numpy.ndarray.reshape()是用来改变numpy数组的形状的,但是它的参数会有一些特殊的用法,这里我们进一步说明一
- 本文实例主要实现给出任意字符串,获取字符串中某字符的位置以及出现的总次数。实现该功能代码的时候可以使用函数enumerate来将字符串分离成
- 本文实例为大家分享了python实现五子棋小游戏的具体代码,供大家参考,具体内容如下暑假学了十几天python,然后用pygame模块写了一
- java.util.regex类支持用正则表达式来匹配和提取字符串,读者可以去官网查看java.util.regex的详细使用方法。首先给出
- ASP.NET利用它可以实现在线备份、还原数据库等各种功能。由于客户的数据库和WEB服务不再同一台服务器,把网站部署在服务器上以后,运行程序
- 初学框架vue搭配vux使用发现这个UI库使用有些力不从心。下面说说自己在表单验证过程遇到的两个需求问题及解决的方法。1.使用x-input
- 主程序import pygamefrom pygame.sprite import Groupfrom settings import Se
- 点云生成 3D 网格的最快方法已经用 Python 编写了几个实现来从点云中获取网格。它们中的大多数
- 最近两天做项目总是被乱码问题困扰着,这不刚把mysql中文乱码问题解决了,下面小编把我的解决方案分享给大家,供大家参考,也方便以后自己查阅。
- ASP+Access数据库的18条安全法则:1.首先,我们需要过滤所有客户端提交的内容,其中包括?id=N一类,另外还有提交的html代码中
- ajax应用非常普及,ajax的优点大家都知道,具体就不多说了,其缺点还真不少,比如破坏浏览器的back功能,同一个url打开的界面并不是完
- 一、相关模块jieba:中文分词wordcloud :Python词云库imageio:读取图形数据安装:pip install&
- 报表服务器数据库可以为一个或多个报表服务器实例提供内部存储。因为报表服务器数据库架构可能会因为推出新的 Reporting Services