python3下实现搜狗AI API的代码示例
作者:黯然销魂掌2015 发布时间:2022-04-11 09:30:58
标签:python3,搜狗AI
1、背景
a、搜狗也发布了自己的人工智能 api,包括身份证ocr、名片ocr、文本翻译等API,初试感觉准确率一般般。
b、基于python3。
c、也有自己的签名生成这块,有了鹅厂的底子,相对写起来比较简单。
d、不过Sougou明显在接口标准化这块明显不如鹅厂,不同api应答包的主体结构竟然不一致,所以实施也只做了简单的结构化……
2、实现代码
直接放代码吧,github上也有: https://github.com/jdstkxx/PySougouAI
1、sogouai-example.py
# -*- coding: utf-8 -*-
'''
create by : joshua zou
create date : 2018.4.9
Purpose: check sougou ai api
'''
import glob,os
from SougouAPIMsg import *
#改成你自己搜狗AI的APPID、APPKEY、SecretKey
AppID = '0000'
ApiKey = '*********'
SecretKey= '0PLvS-AHShmq**************'
if __name__ == "__main__":
sg = SougouAPIMsg(AppID,ApiKey,SecretKey)
for file in glob.glob('D:\python\*.jpg'):
filename=os.path.split(file)[1].split('.')[0]
#调用ocr识别
apiname = 'ocr'
rest =sg.apiSougouOcr(apiname,file)
#调用身份证识别
#rest =sg.apiSougouOcr('idcard',file)
js= rest.json()
retext =""
if apiname=='ocr':
#文字识别,rest应答包,字符串
#成功 {"result":[{"content":"01245177\n","frame":["0,0","207,0","207,59","0,59"]}],"success":1}
#失败 {"success":0}
if js['success']==1 :
retext = js['result'][0]['content'].strip()
elif apiname == 'idcard':
#身份证识别应答包,逼死强迫症啊,请求结构,应答结构都不一样
'''
{
"result": {
"住址": "xxxxxx",
"公民身份号码": "11001xxx30",
"出生": "19900101",
"姓名": "xxXX",
"性别": "X",
"民族": "xxx"
},
"status": 0,
"statusText": "Success"
}
'''
if js['status']==0 :
retext = js['result']['公民身份号码'].strip()
print(filename,retext)
2、SougouAPI.py
# -*- coding: utf-8 -*-
# 搜狗API字典
SougouAPI={
#基本文本分析API
"ocr": {
'APINAME':'图像识别', #API中文简称
'APIDESC': '识别图像中的文字', #API描述
'APIURL': 'http://api.ai.sogou.com/pub/ocr' #API请求URL
},
"idcard":{
'APINAME':'身份证识别', #API中文简称
'APIDESC': '身份证识别', #API描述
'APIURL': 'http://api.ai.sogou.com/pub/ocr/idcard' #API请求URL
},
}
3、SougouAPIMsg.py
# -*- coding: utf-8 -*-
'''
create by : joshua zou
create date : 2018.4.9
Purpose: check sougou ai api
'''
import requests
import base64
import hashlib
import hmac
import time
from urllib import parse
import json
from SougouAPI import *
class SougouAPIMsg(object):
def __init__(self,AppID=None,ApiKey=None,SecretKey=None):
if not AppID: AppID = '88888'
if not ApiKey: ApiKey = '5ADwS88888888Dtr6QG2'
if not SecretKey: SecretKey= '0PLvS-AH8888888889n6NF6fVVTt7m'
self.__app_id= AppID
self.__app_key= ApiKey
self.__app_secret= SecretKey
def get_time_stamp(self):
return str(int(time.time()))
'''
1、应用相关前缀 {AuthPrefix}
{AuthPrefix}=sac-auth-v1/{accessKey}/{secondsSinceEpoch}/{expirationPeriodInSeconds}
2、请求相关数据 {Data}
{Data}={REQUEST_METHOD} + "\n" + {HOST} + "\n" + {URI} + "\n" + {SORTED_QUERY_STRING}
其中,REQUEST_METHOD 为请求使用的 HTTP 方法, 如: GET|POST|PUT|DELETE
HOST 为服务使用的域名, 如: api.ai.sogou.com
URI 为请求的服务路径, 如: /speech/asr
SORTED_QUERY_STRING 把 URL 中的 Query String(即 URL 中 “?” 后面的 “k1=v1&k2=v2” 字符串)进行编码后的结果。
编码方法为:
将 Query String 根据 & 拆开成若干项,对每一项转换为 UriEncode(key) + "=" + UriEncode(value) 的形式, 其中 value 可以是空字符串
将上面转换后的所有字符串按照字典顺序排序。
将排序后的字符串按顺序用 & 符号链接起来。
3、生成签名 {Signature}
{Signature}=HMAC-SHA256-BASE64({secretKey}, {AuthPrefix} + "\n" + {Data})
4、生成认证信息, 通过 Authorization header 传递
Authorization: {AuthPrefix}/{Signature}
Example:
1\应用 accessKey/secretKey 分别为 bTkALtTB9x6GAxmFi9wetAGH / PMROwlieALT36qfdGClVz2iH4Sv8xZxe
POST 方式访问 http://api.ai.sogou.com/speech/asr 接口
GET 参数为 type=gbk&idx=1&starttime=1491810516
当前系统时间为 1491810516
2\计算过程
{AuthPrefix}="sac-auth-v1/bTkALtTB9x6GAxmFi9wetAGH/1491810516/3600"
{Data}="POST\napi.ai.sogou.com\n/speech/asr\nidx=1&starttime=1491810516&type=gbk"
{Signature}=HMAC-SHA256-BASE64("PMROwlieALT36qfdGClVz2iH4Sv8xZxe", {AuthPrefix} + "\n" + {Data})="vuVEkzcnUeFv8FxeWS50c7S0HaYH1QKgtIV5xrxDY/s="
3\最终生成的 header 为
Authorization: sac-auth-v1/bTkALtTB9x6GAxmFi9wetAGH/1491810516/3600/vuVEkzcnUeFv8FxeWS50c7S0HaYH1QKgtIV5xrxDY/s=
'''
def get_auth_sign_str(self,url,method):
res= parse.urlparse(url)
host= res.netloc
uri = res.path
query= res.query
#1生成前置字符串
authprefix= 'sac-auth-v1/%s/%s/%s' %(self.__app_key,self.get_time_stamp(),3600)
#2生成data
query=dict( (k, v if len(v)>1 else v[0] )
for k, v in parse.parse_qs(res.query).items() )
sort_dict= sorted(query.items(), key=lambda item:item[0], reverse = False)
sortquerystr= parse.urlencode(sort_dict)
data= '%s\n%s\n%s\n%s' %(method,host,uri,sortquerystr)
#3生成signstr
signstr ='%s\n%s' %(authprefix,data)
#调用hamc.sha256
shastr =hmac.new(self.__app_secret.encode(), signstr.encode(), digestmod=hashlib.sha256).digest()
#base64编码,还原成字符串
signature = base64.b64encode(shastr).decode()
#4组合成最终的授权码
authstr= '%s/%s' %(authprefix,signature)
return authstr
'''
$file = "OCR-test03.jpg";
$url = "http://api.ai.sogou.com/pub/ocr";
$hdr = array(
"Content-Type: multipart/form-data",
"Authorization: ".sign($ak, $sk, $url, "POST")
); // cURL headers for file uploading
$postfields = array(
"pic" => curl_file_create($file,'image/jpeg','a_b_c.jpg'),
);
$ch = curl_init();
$options = array(
CURLOPT_URL => $url,
CURLOPT_HEADER => false,
CURLOPT_POST => 1,
CURLOPT_HTTPHEADER => $hdr,
CURLOPT_POSTFIELDS => $postfields,
CURLOPT_RETURNTRANSFER => true
);
'''
def apiSougouOcr(self,apiname,picfilename):
url = SougouAPI[apiname]['APIURL']
name = SougouAPI[apiname]['APINAME']
desc= SougouAPI[apiname]['APIDESC']
authstr=self.get_auth_sign_str(url, method='POST')
header={ "Authorization": authstr }
picfile= {'pic':open(picfilename,'rb')}
resp = requests.post(url,headers=header,files=picfile)
#print (resp.text)
来源:http://www.cnblogs.com/zhongtang/p/8777698.html


猜你喜欢
- 本文实例讲述了python中栈的原理及实现方法。分享给大家供大家参考,具体如下:栈(stack),有些地方称为堆栈,是一种容器,可存入数据元
- 1:为什么我得不到变量 我在一网页向另一网页POST数据name,为什么输出$name时却得不到任何值? 在PHP4.2以后的版本中regi
- 随着MYSQL版本的更新以及电脑系统的变化,我们给大家整理了各种电脑环境下安装MYSQL的图解过程,希望我们整理的内容能够帮助到大家:mys
- 禁用admin中models的编辑链接和添加删除按钮方法如下:class MyModelAdmin(models.ModelAdmin):
- 使用索引提高查询速度1.前言在web开发中,页面模板,业务逻辑(包括缓存、连接池)和数据库这三个部分,数据库在其中负责执行SQL查询并返回查
- 我的工作内容可以说是五花八门,策划、文案、设计(包括平面设计、网站设计、VIS设计)、前端代码、交互、测试、摄影、项目管理等。所有这些工作最
- 1.查找重复的行SELECT * FROM blog_user_relation a WHERE (a.account_instance_i
- 给定损失函数的输入y,pred,shape均为bxc。若设定loss_fn = torch.nn.MSELoss(reduction=
- 即使是简单的脚本语言,应用良好的模式可以得到非常“优美”的代码和较高的效率。尤其是对于交互要求较高的B/S系统,非常有必要用设计模式来优化代
- 一 前言前文 介绍了5.5/5.6 版本的MySQL semi sync 基础原理和配置,随着MySQL 5.7 的发布,新版本的MySQL
- 最近遇到了Python访问SqlServer的问题,这里总结下。一、Windows下配置Python访问Sqlserver环境:Window
- python tkinter按钮Button的使用创建和设置窗口from tkinter import *#创建窗口对象root = Tk(
- 使用Python可视化Pygal包来生成可缩放的矢量图形文件!对于在尺寸不同的屏幕上显示图标,它们将自动缩放以适合观看者的屏幕,如果以在线的
- 引用起初我会下意识的回答,直接 v == nil 进行判断不就好了吗?然后翻阅了很多资料终于大致搞定里面的道道.例子请看下面这段代码,可以先
- 本文实例讲述了python随机生成指定长度密码的方法。分享给大家供大家参考。具体如下:下面的python代码通过对各种字符进行随机组合生成一
- 本文介绍一款工具 go-callvis,它能够将 Go 代码的调用关系可视化出来,并提供了可交互式的 web 服务。go get -u gi
- MySQL支持大量的列类型,它可以被分为3类:数字类型、日期和时间类型以及字符串(字符)类型。本节首先给出可用类型的一个概述,并且总结每个列
- 面对缺失值三种处理方法:option 1: 去掉含有缺失值的样本(行)option 2:将含有缺失值的列(特征向量)去掉option 3:将
- 每天急匆匆赶地铁上班的时候总会一不小心就会忘记打卡,尤其是软件打卡,那有没有什么办法可以解决忘打卡的问题呢?今天给大家推荐一下一款神器,利用
- '创建DOM对象set objDom=server.CreateObject("MicroSoft.XMLDom"