一篇文章搞定百度OCR图片文字辨识API
优采云 发布时间: 2020-08-23 09:31一篇文章搞定百度OCR图片文字辨识API
研究百度OCR的API,主要是向做对扫描版的各类PDF进行文字辨识并转Word文档的需求。
这里用Postman客户端进行测试和演示。因为Postman是对各类API操作的最佳入门形式。一旦在Postman里实现了正确的调用,剩下的就只是一键生成代码,和一些细节的更改了。
参考百度云官方文档:文字辨识API参考
下载官方文档PDF:OCR.zh.pdf
授权字符串 Access Token
Token字符串永远是你使用他人API的第一步,简单说,就是只有你自己晓得的密码,在你每次向服务器发送的恳求上面加上这个字符串,就相当于完成了一次登陆。
如果没有Token授权认证,API的访问可能会象浏览网页一样简单。
Access Token通常是调用API最重要也最麻烦的地方了:每个公司都不一样,各种设置安全问题使你的Token复杂化。而百度云的Token,真的是麻烦到一定地步了。
(建议你不要参考,因为它的流程图会先把你村住的)
简单说,获取百度云token字符串的主要流程就是:
等待服务器退还给你一个收录token字符串的数据记住这个token字符串,并拿来访问每一次的API
来瞧瞧怎样借助Postman操作,如下图所示:
填好之后点击Send发送,就会获得一个JSON数据,如下图:
然后你用你的程序(Python, PHP, Node.js等,随便),获取这个JSON中的access_token,
即可用到即将的API恳求中,做为授权认证。
正式调用API: 以"通用文字辨识"为例
API链接:
提交形式:POST
调用方法有两种:
直接把API所需的认证信息置于URL里是最简单最方便的。
建议忽视这些方法,需要填写好多request的标准headers,太麻烦。
Headers设置:
只要填这一项就够了。
Body数据传送的各项参数:
Body的数据如图所示:
然后就可以点Send发送恳求了。
成功后,可以得到百度云返回的一个JSON数据,类似右图:
返回的是一行一行的辨识字符。百度云的识别率是相当高的,几乎100%吧。毕竟是国外本土的机器训练下来的。
API常用地址
以下是百度云的OCR常用API地址,每个API所需的参数都差不多,略有不同。所有的API和地址以及详尽所需的参数,参考官方文档,很简单。一个弄明白了就其他的都明白了。
API恳求地址调药量限制
通用文字辨识
50000次/天免费
通用文字辨识(含位置信息版)
500次/天免费
通用文字辨识(高精度版)
500次/天免费
通用文字辨识(高精度含位置版)
50次/天免费
网络图片文字辨识
500次/天免费