Python使用Cv2模块识别验证码的操作方法
作者:业里村牛欢喜 发布时间:2022-07-03 14:37:19
标签:Python,Cv2,验证码,识别
业务需求
识别验证码图片中的数字信息,用python的图形表示出来了
需求分析
使用Cv2模块、pytesseract模块进行操作。CV2是计算机建模识别的库,用来给图像进行灰度处理,降噪处理,形态学分析。pytesseract模块将智能识别图片字体数字,用于打印出来。
代码一
# -*- conding:utf-8 -*-
#二维码识别,呈现不同效果。
#导入计算机学习开源数据库
import cv2 as cv
#导入计算机识别模块
import pytesseract
#导入图像模块,形成图像
from PIL import Image
#定义函数,导入图像
def recognize_text(image):
#边缘保留滤波,去除噪
dst = cv.pyrMeanShiftFiltering(image,sp=10,sr=150)
#灰度图像
gray = cv.cvtColor(dst,cv.COLOR_BGR2GRAY)
#图像二值化
ret,binary = cv.threshold(gray,0,225,cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
#形态学操作 ,腐蚀,膨胀
erode = cv.erode(binary,None,iterations=2)
dilate = cv.dilate(erode,None,iterations=1)
#逻辑运算,背景设置为白色,字体为黑色,便于识别
cv.imshow('dilate',dilate)
cv.bitwise_not(dilate,dilate)
cv.imshow('binary-image',dilate)
#识别图像
test_message = Image.fromarray(dilate)
text = pytesseract.image_to_string(test_message)
print(f'define result:{text}')
#导入图像
src = cv.imread(r'./image.png')
#显示图像名字为input image,第二个是导入的图像。
cv.imshow('input image',src)
#调取函数导入图像
recognize_text(src)
cv.waitKey(0)
cv.destroyWindow()
结果分析
导入的原图image的图片情况:
编译结果呈现:
代码二
验证码图片Image5.png:
代码模块
import cv2 as cv
import pytesseract
from PIL import Image
def recognize_text(image):
# 边缘保留滤波 去噪
blur = cv.pyrMeanShiftFiltering(image, sp=8, sr=60)
cv.imshow('dst', blur)
# 灰度图像
gray = cv.cvtColor(blur, cv.COLOR_BGR2GRAY)
# 二值化
ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
print(f'二值化自适应阈值:{ret}')
cv.imshow('binary', binary)
# 形态学操作 获取结构元素 开操作
kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 2))
bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
cv.imshow('bin1', bin1)
kernel = cv.getStructuringElement(cv.MORPH_OPEN, (2, 3))
bin2 = cv.morphologyEx(bin1, cv.MORPH_OPEN, kernel)
cv.imshow('bin2', bin2)
# 逻辑运算 让背景为白色 字体为黑 便于识别
cv.bitwise_not(bin2, bin2)
cv.imshow('binary-image', bin2)
# 识别
test_message = Image.fromarray(bin2)
text = pytesseract.image_to_string(test_message)
print(f'识别结果:{text}')
src = cv.imread(r'./image5.png')
cv.imshow('input image', src)
recognize_text(src)
cv.waitKey(0)
cv.destroyAllWindows()
结果呈现
总结经验
cv2,pytesseract的使用不复杂了,按照官方操作手册来使用即可。安装时候记得更换一下源的地址,有一些官方的源不容易搜索到CV2和pytesseract模块了,要更换地址源才可以用。不过代码模块只能识别图片中的数字,对图片中的中文还没有识别出来。可能需要重新写代码。
参考文献
使用Python中的pytesseract模块实现抓取图片中文字
Py之cv2:cv2(OpenCV,opencv-python)库的简介、安装、使用方法(常见函数、图像基本运算等)最强详细攻略
anaconda安装open cv
Python代码实现验证码识别
来源:https://blog.csdn.net/yi247630676/article/details/128528302
0
投稿
猜你喜欢
- 本文实例讲述了Python按行读取文件的实现方法。分享给大家供大家参考,具体如下:小文件:#coding=utf-8#author: wal
- 前言通常我们在一个站站点进行采集的时候,如果是小站的话 我们使用scrapy本身就可以满足。但是如果在面对一些比较大型的站点的时候,单个sc
- 星期五写了个分类信息的小东东!在数据库里只有ip地址,一般访客不太清楚IP地址来源于哪个城市.如果在表里多一个列保存城市又没有真实性可言.如
- 1. Http标准库1.1 http客户端func main() {response, err := http.Get("http
- 1. str.format():使用“{}”占位符格式化字符串(占位符中的索引号形式和键值对形式可以混合使用)。>>> s
- python数据与matlab互通SciPy有时候需要利用python进行科学计算,但需要Matlab进行交互式画图,因此需要掌握pytho
- pandas读取txt文件读取txt文件需要确定txt文件是否符合基本的格式,也就是是否存在\t,,,等特殊的分隔符一般txt文件长成这个样
- (1)最近真是郁闷,在Myeclipse中使用DB Browser但出现以下问题:(2)然后赶紧百度,求大神解决,主要的解决方法试一下几种:
- 发现问题当我用pip安装好opencv-pyton后,我激动得在python项目中导入cv2就像这样:import cv2 as cvbut
- 最近在做深度学习时需要用到图像处理相关的操作,在度娘上找到的图片旋转方法千篇一律,旋转完成的图片都不是原始大小,很苦恼,于是google到歪
- 用Flask处理图片非常容易,这一篇学习一下图片的上传、下载及展示。还是以实例代码演示为主。首先,实现一个简单的上传(过程中未做任何处理,只
- 前言有时候大家需要知道一个关键词在互联网上的热度,想知道某个关键词的热度变化趋势。大家可能就是使用百度指数、微信指数之类的。非常好用,但是就
- 插入排序 插入排序是这样实现的: 首先新建一个空列表,用于保存已排序的有序数列(我们称之为"有序列表")。
- 转自微信公众号:机器学习社区,经作者授权转载时间序列分析是数据科学中一个非常重要的领域,它主要包含统计分析、检测变化点、异常检测和预测未来趋
- 目录1. 理解进程2. 进程的语法3. join自定义进程类4. 守护进程总结1. 理解进程进程的概念:(process)进程就是正在运行的
- 哎~工作忙死了!!!!!!今天在百度老年看到一个手写输入法,颇感新鲜。so把其框下!请不要用在商业用途,学习之用,版权百度所有。看代码!注:
- 我们知道numpy.ndarray.reshape()是用来改变numpy数组的形状的,但是它的参数会有一些特殊的用法,这里我们进一步说明一
- Inserted 表中的行是触发器表中新行的副本。 语法 返回所有列 INSERT INTO [tableName] ([columnNam
- layer的两个函数:get_weights(), set_weights(weights)。详情请参考about-keras-layers
- python中的class_static的@classmethod的使用 classmethod的使用,主要针对的是类而不是对象,在定义类的