python利用 pytesseract快速识别提取图片中的文字((图片识别)
作者:广龙宇 发布时间:2023-06-16 08:00:18
标签:python,pytesseract,图片文字
提示:本文多图,请手机端注意流量。
前言
利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用tesseract识别引擎来实现,一行代码就可以做到提取图片文本。
一、配置环境
1. 安装python依赖
本程序用到了两个python库,pytesseract和PIL,所以先来安装。
运行以下命令
pip install Pillow
pip install pytesseract
如果在python中没有报错,说明程序安装成功,
2. 安装识别引擎
安装完以上两个依赖还需要对应的识别引擎。点击去下载
咱们直接使用5月10号构建的最新版本。
安装tesseract识别引擎(可跳过)
下载完成后打开程序进行安装,先选择语言,这里选择英语English
就行,然后点ok
接下来就是next
,完了点击I Agree
同意协议,
为所有用户安装,然后点next
,如图,
接下来安装中文的语言包用来识别中文
,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,
选择安装路径,建议安装到C盘以外,然后点击next
这里点击安装install
,
等待安装完成
安装完成后,点击next
,再点击finish
完成安装,
验证是否安装成功
添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,
然后在命令行运行tesseract -v
,如果和下图一样,说明你已经安装成功了,
二、使用步骤
1.引入库
from PIL import Image
import pytesseract
2.提取图片文字
将读取图片的一行代码封装为一个函数,
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
在main
函数中直接调用即可,
def main():
read_image('1657158527412.jpg')
3.运行效果
以以下图片为例,
运行效果如下,
from PIL import Image
import pytesseract
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
read_image('img.png')
if __name__ == '__main__':
main()
来源:https://blog.csdn.net/weixin_47754149/article/details/125651707


猜你喜欢
- 本文实例为大家分享了python3实现qq邮箱登陆并发送邮件功能的具体代码,供大家参考,具体内容如下基于selenium,使用chrome浏
- Python产生一个数值范围内的不重复的随机数,可以使用random模块中的random.sample函数,其用法如下:import ran
- vue3 项目封装侧导航文字骨架效果组件-全局封装,供大家参考,具体内容如下目的当显示页面的时候,有些数据是需要从后台加载,网络不好的时候可
- 基本思路就是,使用MIMEMultipart来标示这个邮件是多个部分组成的,然后attach各个部分。如果是附件,则add_header加入
- 本文实例讲述了Python简单实现的代理服务器端口映射功能。分享给大家供大家参考,具体如下:一 代码1、模拟服务端代码import sysi
- 很多书籍里面讲的Python备份都是在linux下的,而在xp上测试一下也可以执行备份功能,代码都差不多相同,就是到执行打包的时候是不一样的
- IE历来被web标准的拥护者所诟病,而当FireFox横空出世以后,更多的网页制作者开始关注web标准设计。看着FireFox的市场占有率不
- 最近无意中接触到了一篇文章,里面写了一个SQL的用法,是with...as,中午抽空记录一下用MySQL试了一下,发现并不支持该语法(版本:
- 对于什么是好设计,一万个人那里至少有一万零一个答案。每个人都有自己的答案,有的人还不止一个答案。老师说,一定要在设计里灌注自己的思想,有了自
- Ansible Inventory 介绍Ansible Inventory 是包含静态 Inventory 和动态 Invent
- Declaring class members or methods as st
- 前言大家应该都有所体会,为了提高验证码的识别准确率,我们当然要首先得到足够多的测试数据。验证码下载下来容易,但是需要人脑手工识别着实让人受不
- 本文以修改用户名密码单元为案例,编写测试脚本。完成修改用户名密码模块单元测试。(ps.这个demo中登陆密码为“admin”)1. 打开浏览
- 用df命令查了下,果然磁盘满了,因为当时分区采用系统默认,不知道为什么不能自动扩容!以后在处理这个问题!如图所示:[root@snsgou
- 使用OpenCV's Haar cascades作为人脸检测,因为他做好了库,我们只管使用。代码简单,除去注释,总共有效代码只有10
- 本文实例讲述了Python pymongo模块用法。分享给大家供大家参考,具体如下:MongoDB优点 MongoDB是一个为当代web应用
- 1.安装2.操作一个简单的Excel文档操作注释及代码:操作完成后,数据存储结果如下:3. 操作简单Excel文档并添加数据格式操作代码如下
- jquery作为一款高质量的框架被大多web开发者所推崇。jquery也的确是一款伟大的产品,在实际开发中明显提高了效率。但是任何产品并不是
- 本文实例讲述了python对数组进行反转的方法。分享给大家供大家参考。具体实现方法如下:arr = [1,2,3]arr.reverse()
- 服务端监听端口 listen()方法:net.listen({监听类型},{监听的ip和端口})(conn, err){}返回值:conn是