python利用 pytesseract快速识别提取图片中的文字((图片识别)
作者:广龙宇 发布时间:2023-06-16 08:00:18
标签:python,pytesseract,图片文字
提示:本文多图,请手机端注意流量。
前言
利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用tesseract识别引擎来实现,一行代码就可以做到提取图片文本。
一、配置环境
1. 安装python依赖
本程序用到了两个python库,pytesseract和PIL,所以先来安装。
运行以下命令
pip install Pillow
pip install pytesseract
如果在python中没有报错,说明程序安装成功,
2. 安装识别引擎
安装完以上两个依赖还需要对应的识别引擎。点击去下载
咱们直接使用5月10号构建的最新版本。
安装tesseract识别引擎(可跳过)
下载完成后打开程序进行安装,先选择语言,这里选择英语English
就行,然后点ok
接下来就是next
,完了点击I Agree
同意协议,
为所有用户安装,然后点next
,如图,
接下来安装中文的语言包用来识别中文
,需要滑到下面,选择中文,我这里横排简体中文和竖排简体中文都选择了,完成后点击next,
选择安装路径,建议安装到C盘以外,然后点击next
这里点击安装install
,
等待安装完成
安装完成后,点击next
,再点击finish
完成安装,
验证是否安装成功
添加环境变量,就是你安装到的那个文件夹路径,直接加到path里面,
然后在命令行运行tesseract -v
,如果和下图一样,说明你已经安装成功了,
二、使用步骤
1.引入库
from PIL import Image
import pytesseract
2.提取图片文字
将读取图片的一行代码封装为一个函数,
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
在main
函数中直接调用即可,
def main():
read_image('1657158527412.jpg')
3.运行效果
以以下图片为例,
运行效果如下,
from PIL import Image
import pytesseract
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
read_image('img.png')
if __name__ == '__main__':
main()
来源:https://blog.csdn.net/weixin_47754149/article/details/125651707
0
投稿
猜你喜欢
- 简介桥接模式又叫桥梁模式,属于结构型模式。目的是将抽象与实现分离,使它们都可以独立的变化,解耦。继承有很多好处,但是会增加耦合,而桥接模式偏
- 什么是树表查询?借助具有特殊性质的树数据结构进行关键字查找。本文所涉及到的特殊结构性质的树包括:二叉排序树。 平衡二叉树。使用上述树结构存储
- 不知道怎么忽然想看这个,呵呵 小我的python的反shell的代码 #!/usr/bin/python # Python&nbs
- 背景重装系统,发现之前装在E盘的python可以直接使用,就只是将python的安装目录加入到环境变量中,也一直没有管它,今天跟天软交互的时
- 本文主要介绍 SQLServerExpress2008不用第三方工具调试T-SQL语句,经过本文的介绍,用SQLSERVER2008 Man
- <?php //作者:遥远的期待 //QQ:15624575 //算法分析:1、必须是整数序列、2、如果整个序列不全是负数,最大子序列
- 本文实例讲述了php计算给定日期所在周的开始日期和结束日期。分享给大家供大家参考,具体如下:<?php/** * 取得给定日期所在周的
- Python做了一个词云视频,以另一种角度来看小姐姐跳舞制作过程分为以下几个部分1、视频下载首先需要下载一个小姐姐跳舞的视频,这里我用的是
- 前言np.argmax是用于取得数组中每一行或者每一列的的最大值。常用于机器学习中获取分类结果、计算精确度等。函数:numpy.argmax
- 目录1.技术背景2.问题复现3.解决思路4.总结概要1.技术背景笔者在执行一个Jax的任务中,又发现了一个奇怪的问题,就是明明只分配了很小的
- 以下测试用于去除任何字符串中连线的分隔符 代码如下:--去除字符串中连续的分隔符 declare @str nvarchar(200) de
- 传统的网页BBS大多是采用CGI模式实现的,它的实现要求编程者既要掌握编程语言如Perl或C等,又要了解关于CGI模式的各项技术内容,因此要
- 前言现在Python3 被越来越多的开发者所接受,同时让人尴尬的是很多遗留的老系统依旧运行在 Python2 的环境中,因此有时你不得不同时
- 如何优雅地解析命令行选项随着我们编程经验的增长,对命令行的熟悉程度日渐加深,想来很多人会渐渐地体会到使用命令行带来的高效率。自然而然地,我们
- 细线边框是网页中定位区分内容常用的一种方法,配合特定图片的使用,往往能够达到不错的效果,那么如何制作细线边框呢?asp之家注:现在要实现这个
- 目录wsgi 相关概念CGIWSGIASGIcgi 示例cgi脚本cgi服务实现wsgirefwsgi 小结小技巧python web开发中
- 1. 错误描述之前在学习Python的过程中,导入自己写的包文件时,与之相关的方法等都会被划红线,但并不影响代码执行,如图:看着红线确实有点
- 本文为大家分享一个简单商城购物车的python代码,供大家参考,具体内容如下要求:1、写一段商城程购物车序的代码2、用列表把商城的商品清单存
- 数据库的选择原则是什么?我只知道小网站用Access,大网站用SQL,请问它的具体选择原则是什么?在实际应用中,数据库的选择原则一般是:如果
- 前段时间,在pycharm里配置了远程的Python解释器,然后在使用过程中,发现pycharm原来是可以使用Jupyter的文件,而且还可