一篇文章搞定百度OCR图片文字辨识API

优采云 发布时间: 2020-08-23 09:31

  一篇文章搞定百度OCR图片文字辨识API

  研究百度OCR的API,主要是向做对扫描版的各类PDF进行文字辨识并转Word文档的需求。

  这里用Postman客户端进行测试和演示。因为Postman是对各类API操作的最佳入门形式。一旦在Postman里实现了正确的调用,剩下的就只是一键生成代码,和一些细节的更改了。

  参考百度云官方文档:文字辨识API参考

  下载官方文档PDF:OCR.zh.pdf

  授权字符串 Access Token

  Token字符串永远是你使用他人API的第一步,简单说,就是只有你自己晓得的密码,在你每次向服务器发送的恳求上面加上这个字符串,就相当于完成了一次登陆。

  如果没有Token授权认证,API的访问可能会象浏览网页一样简单。

  Access Token通常是调用API最重要也最麻烦的地方了:每个公司都不一样,各种设置安全问题使你的Token复杂化。而百度云的Token,真的是麻烦到一定地步了。

  (建议你不要参考,因为它的流程图会先把你村住的)

  简单说,获取百度云token字符串的主要流程就是:

  等待服务器退还给你一个收录token字符串的数据记住这个token字符串,并拿来访问每一次的API

  来瞧瞧怎样借助Postman操作,如下图所示:

  

  填好之后点击Send发送,就会获得一个JSON数据,如下图:

  

  然后你用你的程序(Python, PHP, Node.js等,随便),获取这个JSON中的access_token,

  即可用到即将的API恳求中,做为授权认证。

  正式调用API: 以"通用文字辨识"为例

  API链接:

  提交形式:POST

  调用方法有两种:

  直接把API所需的认证信息置于URL里是最简单最方便的。

  建议忽视这些方法,需要填写好多request的标准headers,太麻烦。

  Headers设置:

  只要填这一项就够了。

  Body数据传送的各项参数:

  Body的数据如图所示:

  

  然后就可以点Send发送恳求了。

  成功后,可以得到百度云返回的一个JSON数据,类似右图:

  

  返回的是一行一行的辨识字符。百度云的识别率是相当高的,几乎100%吧。毕竟是国外本土的机器训练下来的。

  API常用地址

  以下是百度云的OCR常用API地址,每个API所需的参数都差不多,略有不同。所有的API和地址以及详尽所需的参数,参考官方文档,很简单。一个弄明白了就其他的都明白了。

  API恳求地址调药量限制

  通用文字辨识

  50000次/天免费

  通用文字辨识(含位置信息版)

  500次/天免费

  通用文字辨识(高精度版)

  500次/天免费

  通用文字辨识(高精度含位置版)

  50次/天免费

  网络图片文字辨识

  500次/天免费

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线