Python3实现获取图片文字里中文的方法分析
作者:huxiangen 发布时间:2023-09-19 09:31:34
本文实例讲述了Python3实现获取图片文字里中文的方法。分享给大家供大家参考,具体如下:
一、运行环境
(1) win10
(2) pycharm
(3) python 3.5
(4) pillow与pytesseract库安装:
pip3 install pillow
pip3 install pytesseract
(5) 识别引擎tesseract-ocr ,下载之后解压安装,下载地址:https://www.jb51.net/softs/538925.html
二、 运行代码
# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #设置为中文文字的识别
#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng') #设置为英文或阿拉伯字母的识别
print(text)
三、报错解决
1.FileNotFoundError:[WinError 2]系统找不到指定文件。
解决办法:
打开文件pytesseract.py,找到如下代码,将tesseract_cmd的值修改为全路径,再次使用就不会报这个错了。
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr
解决办法:
打开文件pytesseract.py,找到image_to_string,指定config的参数,如下:
tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):
希望本文所述对大家Python程序设计有所帮助。
来源:https://blog.csdn.net/huxiangen/article/details/78877444


猜你喜欢
- 一个不错的二级联动下拉菜单源码,您一定会用得到的。运行代码:<html><head><title>Lis
- Python现在是最热门的人工智能语言,各种工具的支持如Google的Tensorflow,都是首选支持Python的。但是,与R语言不同,
- 一段简单的pygame代码,只在pygame界面背景绘制了一个背景图片# -*- coding=utf-8 -*-import sysimp
- import osimport sysimport ftplibimport socket#########################
- 如下所示:from statsmodels.tsa.stattools import adfullerprint(adfuller(data
- 物质世界客观存在,而人的“视觉成像”是对当前世界的“唯心”重建。这种重建基于个人“经验”、“感知”和“集体意识”。最初科学家认为人类通过视觉
- 一、需求说明需要使用Python实现将内容转为base64编码,解码,方便后续的数据操作。二、base64简介Base64是一种二进制到文本
- 官方教程http://www.kuitao8.com/demo/20140224/1/bootstrap-multiselect-maste
- 误区 #7:一个数据库可以存在多个镜像 错误 这个误区就有点老生常谈了。每一个主体服务器只允许一个镜像服务器。如果你希望存在多个主体服务器的
- 原因是dict.keys()的返回结果不再是一个list了Python3的keys(), values(), items()返回的都是迭代器
- 工具python3.7PycharmExcelpython-docx生成Word案例创建一个demo.doc文档,代码如下:from doc
- vim /etc/my.cnf注释这一行:bind-address=127.0.0.1 ==> #bind-address=127.0
- 本文实例讲述了SQL Server日期加减函数DATEDIFF与DATEADD用法。分享给大家供大家参考,具体如下:SQL Server 日
- XML的嵌套处理 一般情况下,我们从数据库中查询得到的结果集可能很大,所以从服务器返回到客户端时,数据会被分成若干个页面分别进行传递。此时,
- 应该是很方便的了,支持几乎所有主流浏览器(ie5,6,7,8;ff;傲游;Opera)已更新至可提交录入内容<script type=
- 今天我给大家分享的是在不刷新页面的前提下,使用PHP+jQuery+Ajax实现多图片上传的效果。用户只需要点击选择要上传的图片,然后图片自
- 目录自动化测试框架1.基础层(通用层)2.功能层(页面层)3.业务层4.用例层4层框架对应的项目工程总结自动化测试框架项目自动化测试框架设计
- MSSQL差异备份,就是和前一次备份作对比,把不一样的内容备份下来,这样,只要前一次备份后,插入新的内容,差异备份就可以把刚插入的内容备份出
- 对于html中的一些元素注册事件的方式有多种 第一种: <script> function test() { alert(&qu
- 在MyEclipse中JSON字符串的换行值是不同的,必须以'/n'换行,如果只是json验证的问题,可以把json的验证关