Python 识别12306图片验证码物品的实现示例
作者:Smile_Mr 发布时间:2021-04-03 22:17:24
1、PIL介绍以及图片分割
Python 3 安装: pip3 install Pillow
1.1 image 模块
Image模块是在Python PIL图像处理中常见的模块,主要是用于对这个图像的基本处理,它配合open、save、convert、show…等功能使用。
from PIL import Image
#打开文件代表打开pycharm中的文件
im = Image.open('1.jpg')
#展示图片
im.show()
1、Crop类
拷贝这个图像。如果用户想粘贴一些数据到这张图,可以使用这个方法,但是原始图像不会受到影响。
im.crop(box) ⇒ image
从当前的图像中返回一个矩形区域的拷贝。变量box是一个四元组,定义了左、上、右和下的像素坐标。用来表示在原始图像中截取的位置坐标,如box(100,100,200,200)就表示在原始图像中以左上角为坐标原点,截取一个100*100(像素为单位)的图像。
from PIL import Image
im = Image.open("pic1.jpg")
##确定拷贝区域大小
box = (5, 41, 72, 108)
##将im表示的图片对象拷贝到region中,大小为box
region = im.crop(box)
region.show()
实战一:12306图像分割并保存
from PIL import Image
#切割图像,由于下载的图片都是有固定的位置,所以直接控制像素进行切割就行了
def cut_img(im, x, y):
assert 0 <= x <= 3
assert 0 <= y <= 2
left = 5 + (67 + 5) * x
top = 41 + (67 + 5) * y
right = left + 67
bottom = top + 67
return im.crop((left, top, right, bottom))
if __name__ == '__main__':
im = Image.open("./pic1.jpg")
#控制y轴
for y in range(2):
#控制x轴
for x in range(4):
im2 = cut_img(im, x, y)
im2.save('./images/%s_%s.png'%(y,x))
2、百度平台接口实现
2.1.平台接入:
1.打开https://ai.baidu.com/进入控制台,选择文字识别服务。
2.创建应用,如图示:
3.输入应用名称、描述,并选择应用类型,之后点击“立即创建”按钮。
4.创建完毕,点击“返回应用列表”。
5.此处显示AK,SK,后面程序中会用到
3. 官方文档的读取
1.打开https://ai.baidu.com/docs#/OCR-API/top 文档说明
需要用到的信息有:
(1)图像识别URL: https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general
(2)Header格式:Content-Type:application/x-www-form-urlencoded
(3) 请求参数:image和multi_detect两个参数,image为图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M。
(4)返回参数:车牌颜色Color、车牌号码number等。
#!/usr/bin/python
# -*- coding: utf-8 -*-
import base64
import requests
import os
import time
#todo:获取百度权限验证码access_token
def get_token():
get_token_url = "https://aip.baidubce.com/oauth/2.0/token"
params = {
"grant_type": "client_credentials",
"client_id": "7ax98QuWU5l2zTbaOkzvKgxE",
"client_secret": "INugQTM2DAfNFgfxtvgR7eF8AHPFGP5t",
}
res = requests.get(get_token_url, params).json()
return res["access_token"]
#todo:通过权限验证码和图片进行识别物品
def get_result(access_token,image):
url = "https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general"
#打开文件并进行编码
with open(image, 'rb')as f:
image = base64.b64encode(f.read())
# image =
#头部信息
headers = {
'Content-Type': 'application/x-www-form-urlencoded'
}
#发送数据
data = {
"access_token": access_token,
"image": image
}
#发送请求,并返回识别数据
res = requests.post(url, headers=headers, data=data).json()
if res:
result = res['result']
return result
#todo:获取图片关键物品
def get_keywords(result):
#按照最大匹配率进行排序,并获取左最后一个
max_score = sorted(result,key=lambda x:x['score'])[-1]
# print(max_score['keyword'])
keyword = max_score['keyword']
return keyword
if __name__ == '__main__':
access_token = get_token()
get_result(access_token,'pic1.jpg')
datas = []
for root,dir,files in os.walk('images'):
for file in files:
image = os.path.join(root,file)
result = get_result(access_token,image)
keyword = get_keywords(result)
print(keyword)
time.sleep(1)
datas.append(keyword)
print(datas)
总结:
PIL介绍以及图片分割
百度AI图像识别实例搭建
识别12306类别码
来源:https://blog.csdn.net/Smile_Mr/article/details/104020465


猜你喜欢
- 函数:原型每一个构造函数都有一个属性叫做原型(prototype,下面都不再翻译,使用其原文)。这个属性非常有用:为一个特定类声明通用的变量
- MatplotlibMatplotlib 是Python中类似 MATLAB 的绘图工具,熟悉 MATLAB 也可以很快的上手 Matplo
- 在我们修改过页面的某些数据后,通过想要把页面刷新一下,看看修改后的结果。由于vue的存在,页面是不会自动刷新的,需要我们手动进行操作。在vu
- 在一个网站,大量数据的前后端交互,JSON是最好的传递数据方式了。在Django中,使用JSON传输数据,有两种方式,一种是使用Python
- 关于一些代码里的解释,可以看我上一篇发布的文章,里面有很详细的介绍!!!可以依次把下面的代码段合在一起运行,也可以通过jupyter not
- MySQL 客户端连接成功后,通过 show [session|global]status 命令 可以提供服务器状态信息,也可以在操作系统上
- MySQL内建复制功能来优化可用性,在Soundbreak我们每天24小时不间断地播放实况音频和视频,所以对于MySQL的新增的复制特性,我
- 场景一、有一个输入金额的场景,这个金额需要验证,验证说明如下:不能为空格;不能为0;不能为汉字;不能为其它字符;不能大于200;唯一可以的是
- 一、前言在写业务代码时候,有许多场景需要重试某块业务逻辑,例如网络请求、购物下单等,希望发生异常的时候多重试几次。本文分享如何利用Pytho
- 一、Mysql SQL Mode简介通常来说MySQL服务器能够工作在不同的SQL模式下,并能针对不同的客户端以不同的方式应用这些模式。这样
- 什么是xml?xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。abc.xml<
- 数据库备份的分类物理备份:数据库操作系统的物理文件(如数据文件,日志文件等)的备份物理备份的方法:冷备份(脱机备份):是在关闭数据库时候进行
- 本文实例讲述了PHP版微信小店接口开发方法。分享给大家供大家参考,具体如下:首先 大家可以去下一份小店开发的 API接口 因为 下面所有的
- 1.安装虚拟环境虚拟环境是真实python环境的复制版本。安装虚拟环境的命令:1)sudo pip install virtualenv #
- 今天填一个坑,俄罗斯方块!!俄罗斯方块的移动不难实现,但是旋转就不太容易实现,究其原因是因为Python中没有数组这种数据结构,所以不能用矩
- 概述从今天开始我们将开启一段自然语言处理 (NLP) 的旅程. 自然语言处理可以让来处理, 理解, 以及运用人类的语言, 实现机器语言和人类
- 聚类今天说K-means聚类算法,但是必须要先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。分
- 前言ECMAScript 6.0(以下简称 ES6)是 JavaScript 语言的下一代标准,已经在2015年6月正式发布了。它的目标,是
- Python中可以使用 pickle 模块将对象转化为文件保存在磁盘上,在需要的时候再读取并还原。具体用法如下:pickle是Python库
- MySql Server安装步骤如下所示:1安装MySql Server2 安装MySqlServer管理工具解压中文语言包,将文件复制到安