Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解
作者:彭世瑜 发布时间:2023-11-16 22:45:05
标签:Python,OCR
百度OCR体验地址:
https://ai.baidu.com/tech/imagerecognition/general
腾讯OCR体验地址:
https://cloud.tencent.com/act/event/ocrdemo
测试结果是:腾讯的效果要比百度的好
腾讯云目前额度是:
每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月
百度接口调用之前写过文章
python实现百度OCR图片识别过程解析
使用步骤
1、注册账号: https://cloud.tencent.com/
2、开通服务:https://console.cloud.tencent.com/ocr/general
3、申请访问秘钥:https://console.cloud.tencent.com/cam/capi
4、通过 API 或 SDK 或命令行来使用服务
具体参考《操作指南》:https://cloud.tencent.com/document/product/866/17622
接口使用
1、安装SDK
https://github.com/TencentCloud/tencentcloud-sdk-python
pip3 install tencentcloud-sdk-python
2、代码实例
# -*- coding: utf-8 -*-
import json
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.ocr.v20181119 import ocr_client
from tencentcloud.ocr.v20181119.models import (
GeneralAccurateOCRRequest,
EnglishOCRRequest,
GeneralBasicOCRRequest,
GeneralEfficientOCRRequest,
GeneralFastOCRRequest,
GeneralHandwritingOCRRequest
)
class TencentOcr(object):
"""
计费说明:1,000次/月免费
https://cloud.tencent.com/document/product/866/17619
"""
SECRET_ID = "你的秘钥 SECRET_ID"
SECRET_KEY = "你的秘钥 SECRET_KEY"
# 地域列表
# https://cloud.tencent.com/document/api/866/33518#.E5.9C.B0.E5.9F.9F.E5.88.97.E8.A1.A8
Region = "ap-beijing"
endpoint = "ocr.tencentcloudapi.com"
# 通用文字识别相关接口
# https://cloud.tencent.com/document/api/866/37173
mapping = {
# 通用印刷体识别(高精度版) ok
"GeneralAccurateOCR": GeneralAccurateOCRRequest,
# 英文识别 ok
"EnglishOCR": EnglishOCRRequest,
# 通用印刷体识别 一般
"GeneralBasicOCR": GeneralBasicOCRRequest,
# 通用印刷体识别(精简版)(免费公测版)no
"GeneralEfficientOCR": GeneralEfficientOCRRequest,
# 通用印刷体识别(高速版)一般
"GeneralFastOCR": GeneralFastOCRRequest,
# 通用手写体识别 ok
"GeneralHandwritingOCR": GeneralHandwritingOCRRequest,
}
def __init__(self):
cred = credential.Credential(self.SECRET_ID, self.SECRET_KEY)
httpProfile = HttpProfile()
httpProfile.endpoint = self.endpoint
clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
self.client = ocr_client.OcrClient(cred, self.Region, clientProfile)
def get_image_text(self, image_url, ocr="GeneralAccurateOCR"):
req = self.mapping[ocr]()
req.ImageUrl = image_url
resp = getattr(self.client, ocr)(req)
return json.loads(resp.to_json_string())['TextDetections'][0]['DetectedText']
def main():
tencentOcr = TencentOcr()
url = "https://ocr-demo-1254418846.cos.ap-guangzhou.myqcloud.com/general/GeneralBasicOCR/GeneralBasicOCR3.jpg"
print(tencentOcr.get_image_text(url, ocr="GeneralHandwritingOCR"))
if __name__ == '__main__':
main()
来源:https://blog.csdn.net/mouday/article/details/104346484
0
投稿
猜你喜欢
- 新标准的熟悉和入门内容: 还在用 HTML 编写文档?如果是的话,就不符合当前标准了。2000 年&
- 一、引言这个五一假期自驾回老家乡下,家里没装宽带,用手机热点方式访问网络。这次回去感觉4G信号没有以前好,通过百度查找小说最新更新并打开小说
- PHP SESSION 的存储Session会话存储方式PHP将session以文件的形式存储服务器的文件中,session.save_pa
- 经过总结,Python创建多线程主要有如下两种方法:函数类接下来,我们就来揭开多线程的神秘面纱。1. 用函数创建多线程在Python3中,P
- 支付宝十年账单上的数字有点吓人,但它统计的项目太多,只是想看看到底单纯在淘宝上支出了多少,于是写了段脚本,统计任意时间段淘宝订单的消费情况,
- ff默认不让改 statusopera9 测试通过ie6 测试通过这东西是给统计部门用的,分析用户习惯以改良网站布局
- 当很多人发现在DW4中定义CSS很方便的时候,开始报怨FP2000不能定义CSS,甚至就此抨击FP2000如何的不好。事实上,在FP2000
- MySQL插件式存储引擎是MySQL数据库服务器中的组件,负责为数据库执行实际的数据I/O操作,并能允许和强制执行面向特殊应用需求的特定特性
- 我设计第一篇网页的时候,就遇到了字体的设置问题。我发现如果用软件约定的字体大小,则显示效果会很难看的。我是用FrontPage2000作网页
- 此代码适合你做网站用,普通朋友可以不用理这个东西!ASP:<%dim objXMLHTTP, qq, pwd qq = &
- 数据库镜像是将数据库事务处理从一个数据库移动到不同环境中的另一个数据库中。镜像的拷贝是一个备用的拷贝,不能直接访问,它只用在错误恢复的情况下
- 一、前言本文就从数据爬取、数据清洗、数据可视化,这三个方面入手,但你简单完成一个小型的数据分析项目,让你对知识能够有一个综合的运用。整个思路
- 你们要的3D太阳系图片上传之后不知为何帧率降低了许多。。。日地月三体所谓三体,就是三个物体在重力作用下的运动。由于三点共面,所以三个质点仅在
- pip源配置文件可以放置的位置:Linux/Unix:/etc/pip.con~/.pip/pip.conf (每一个我都找了都没有,所以我
- 开发过程中,错误免不了。为了纠正错误与规范化。可以使用MS SQL Server的系统存储过程sp_rename与OBJECTPROPERT
- 2天内的现实new文字 <%if DateDiff("d",rs("date"),date()
- 1.文件写入#打开文件,路径不对会报错f = open(r"C:\Users\jm\Desktop\pyfile.txt"
- 本文实例讲述了Yii2框架实现登陆添加验证码功能。分享给大家供大家参考,具体如下:models中LoginForm.phppublic $v
- 随着网络的发展,网速和机器速度的提高,越来越多的网站用到了丰富客户端技术。而现在Ajax则是最为流行的一种方式。JavaScript是一种解
- 一、问题描述给定两个字符串,求解这两个字符串的最长公共子序列(Longest Common Sequence)。比如字符串1:BDCABA;