python PaddleOCR库用法及知识点详解
作者:小妮浅浅 发布时间:2023-02-04 16:01:03
标签:python,PaddleOCR库
说明
1、PaddleOCR是基于深度学习的ocr识别库,中文识别精度相当还不错,能够应对大多数文字提取需求。
2、需要依次安装三个依赖库,shapely库可能会受到系统的影响,出现安装错误。
安装命令
pip install paddlepaddle
pip install shapely
pip install paddleocr
代码实现
ocr = PaddleOCR(use_angle_cls=True,)
# 输入待识别图片路径
img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
# 输出结果保存路径
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = Image.fromarray(im_show)
im_show.show()
内容扩展:
简介
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
近期更新
2020.8.26 更新OCR相关的84个常见问题及解答,具体参考FAQ
2020.8.24 支持通过whl包安装使用PaddleOCR,具体参考Paddleocr Package使用说明
2020.8.21 更新8月18日B站直播课回放和PPT,课节2,易学易用的OCR工具大礼包,获取地址
2020.8.16 开源文本检测算法SAST和文本识别算法SRN
2020.7.23 发布7月21日B站直播课回放和PPT,课节1,PaddleOCR开源大礼包全面解读,获取地址
2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO,支持iOS和Android系统
特性
超轻量级中文OCR模型,总模型仅8.6M
单模型支持中英文数字组合识别、竖排文本识别、长文本识别
检测模型DB(4.1M)+识别模型CRNN(4.5M)
实用通用中文OCR模型
多种预测推理部署方案,包括服务部署和端侧部署
多种文本检测训练算法,EAST、DB、SAST
多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE、SRN
可运行于Linux、Windows、MacOS等多种系统
来源:https://www.py.cn/jishu/jichu/31666.html
0
投稿
猜你喜欢
- 首先,看一下sql server,之前我们都通过前台用户选择一个起始时间和一个结束时间(以日为最小单位),然后来作为条件进行查询,如果直接通
- 建立连接在WPF当中,需要为View与ViewModel建立连接, 我们需要找到View的DataContext, 如下所示:建立连接的方式
- 生成方式Python中想要自动生成 model文件可以通过 sqlacodegen这个命令来生成对应的model文件sqlacodegen
- 本文实例为大家分享了vue实现滑动验证条的具体代码,供大家参考,具体内容如下效果代码VerifySlider.vue<template
- 今天在数据分析时遇到了一个小问题,这时才发现自己的基础知识真的不牢固,所以这里记录一下解决方法问题:我在处理完数据后得到的是一个列表,其中放
- 最近媳妇工作上遇到一个重复性劳动,excel表格查重,重复的标记起来,问我能不能写个程序让它自动查重标记必须安排第一次正儿八经写python
- 2020.3.7准备scrapy,使用anaconda创建一个新的环境,执行“conda create -n scrapyEnv pytho
- 请问如何用OleDbDataAdapter来对数据库进行删除、修改和添加?OleDbDataAdapter是DataSet和数据源之间建立联
- 一、分块查找算法分块查找是二分法查找和顺序查找的改进方法,分块查找要求索引表是有序的,对块内结点没有排序要求,块内结点可以是有序的也可以是无
- 正在看的ORACLE教程是:Oracle 数据表分区的策略。本文描述通过统计分析出医院信息系统需分区的表,对需分区的表选择分区键,即找出包括
- 数据库系统的安全性包括很多方面。由于很多情况下,数据库服务器容许客户机从网络上连接,因此客户机连接的安全对MySQL数据库安全有很重要的影响
- 前言在日常中有时需将 html 文件转换为 pdf、word 文件。网上免费的大多数不支持多个文件转换的情况,而且在转换几个后就开始收费了。
- bootstrap前端开发工具栅格系统版心 .container栅格布局 (一行分为12格,响应式布局).row.col-md-12.col
- 在这个文章中,我们将学习如何在感兴趣区域周围画最小面积矩形框。1.最小面积矩形框下图显示了两个矩形框,绿色的是普通矩形框,红色的是最小面积矩
- 一、参数的定义1、函数的参数在哪里定义在python中定义函数的时候,函数名后面的括号里就是用来定义参数的,如果有多个参数的话,那么参数之间
- pydantic是一个Python的数据验证和转换库,它的特点是轻量、快速、可扩展、可配置。笔者常用的用于数据接口schema定义与检查。具
- 注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字。#coding:utf-8 import shutil
- 如下所示:def is_img(ext): ext = ext.lower() if ext == '.jpg': &nbs
- 本文实例讲述了Python实现的knn算法。分享给大家供大家参考,具体如下:代码参考机器学习实战那本书:机器学习实战 (Peter Harr
- 路由路由可以定义在工程的目录下(看你的需求),也可以定义在各个应用中来保存应用的路由,用主路文件urls中使用include()包含各个应用