Python实现识别图片内容的方法分析
作者:CyborgLin 发布时间:2022-01-04 21:10:51
本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:
python识别图片内容。
这里我的环境为windows64位,python2.7.14
需要用到PIL模块和tesseract模块。
首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip
安装PIL模块:
pip install Pillow
tesseract模块安装:
pip install pytesseract
安装识别引擎和中文语言包,点击此处本站下载。
下载完成解压:
1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract'
的内容:
# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'
2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata
环境配置完成。
python代码:
# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text
附:windows下安装python包管理器pip
windows下安装python包管理器pip。
pip下载地址:https://pypi.python.org/pypi/pip#downloads
选择 pip-9.0.1.tar.gz (md5, pgp)
下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1
cd D:\python\pip-9.0.1
安装pip
python setup.py install
安装完成,输入pip list
查看是否成功
pip list
显示下面信息代表安装成功:
pip (9.0.1)
setuptools (28.8.0)
pip安装模块命令:
pip install xxx
希望本文所述对大家Python程序设计有所帮助。
来源:https://blog.csdn.net/mxdzchallpp/article/details/79113262
猜你喜欢
- sys模块在使用python开发脚本的时候,作为一个运维工具,或者是其他工具需要在接受用户参数运行时,这里就可以用到命令行传参的方式,可以给
- 源码如下from scapy.all import *import logginglogging.getLogger('scapy.
- 代码import imutilsimport cv2image = cv2.imread('') # translate t
- 有时需要根据项目的实际需求向spider传递参数以控制spider的行为,比如说,根据用户提交的url来控制spider爬取的网站。在这种情
- 我就废话不多说了,大家还是直接看代码吧!import pandas as pddef get_under_rolling(df,window
- 本文实例为大家分享了python使用turtle库绘制树的具体代码,供大家参考,具体内容如下# -*- coding: utf-8 -*-&
- 在SQL Server中进行开发会让你身处险地,并且寻找快速解决方案。我们编辑了前十名关于SQL Server开发的常见问题。对常见的针对表
- import timefrom selenium import webdriverfrom selenium.webdriver.commo
- 线性回归是基本的统计和机器学习技术之一。经济,计算机科学,社会科学等等学科中,无论是统计分析,或者是机器学习,还是科学计算,都有很大的机会需
- 前言django,web开发中,用django-debug-toolbar来调试请求的接口,无疑是完美至极。 可能本人,见识博浅,才说完美至
- 使用python进行websocket的客户端压力测试,这个代码是从github上 找到。然后简单修改了下。大神运用了进程池,以及线程池的内
- 本文实例讲述了Symfony2之session与cookie用法。分享给大家供大家参考,具体如下:session操作:1. Set Sess
- 经常有网友会问,SQL Server占用了太多的内存,而且还会不断的增长;或者说已经设置了使用内存,可它没有用到那么多,这是怎么一回事儿呢?
- 大家好,今天我们要讲的是如何使用 Pyecharts 制作动态排名变化图:point_down:制作这样的一个动态图使用到的是 Pyecha
- java JSP开发之Spring中Bean的使用在传统的Java应用中,bean的生命周期很简单。使用Java关键字new进行bean实例
- 这篇文章给大家介绍Django中使用 Closure Table 储存无限分级数据,具体内容如下所述:起步对于数据量大的情况(比如用户之间有
- 一、何为php PHP,即“PHP: Hypertext Preprocesso
- 本文实例为大家分享了Python实现名片管理系统的具体代码,供大家参考,具体内容如下目标综合应用已经学习过的知识点:变量流程控制函数模块系统
- Python获取pid和进程名字1、安装psutilpip install psutil如果pip不识别,就进入下载的python目录下面执
- Python中的数据类型共有六个,分别是:字符串,数字,布尔类型,列表,元祖,字典,集合其中分为可变的类型和不可变的:可变类型:列表,字典,