一篇文章搞定百度OCR图片文字辨识API

优采云发布时间: 2020-08-23 09:31

　　研究百度OCR的API，主要是向做对扫描版的各类PDF进行文字辨识并转Word文档的需求。

　　这里用Postman客户端进行测试和演示。因为Postman是对各类API操作的最佳入门形式。一旦在Postman里实现了正确的调用，剩下的就只是一键生成代码，和一些细节的更改了。

　　参考百度云官方文档：文字辨识API参考

　　下载官方文档PDF：OCR.zh.pdf

　　授权字符串 Access Token

　　Token字符串永远是你使用他人API的第一步，简单说，就是只有你自己晓得的密码，在你每次向服务器发送的恳求上面加上这个字符串，就相当于完成了一次登陆。

　　如果没有Token授权认证，API的访问可能会象浏览网页一样简单。

　　Access Token通常是调用API最重要也最麻烦的地方了：每个公司都不一样，各种设置安全问题使你的Token复杂化。而百度云的Token，真的是麻烦到一定地步了。

　　(建议你不要参考，因为它的流程图会先把你村住的)

　　简单说，获取百度云token字符串的主要流程就是：

　　等待服务器退还给你一个收录token字符串的数据记住这个token字符串，并拿来访问每一次的API

　　来瞧瞧怎样借助Postman操作，如下图所示：

　　填好之后点击Send发送，就会获得一个JSON数据，如下图：

　　然后你用你的程序(Python, PHP, Node.js等，随便)，获取这个JSON中的access_token，

　　即可用到即将的API恳求中，做为授权认证。

　　正式调用API：以"通用文字辨识"为例

　　API链接：

　　提交形式：POST

　　调用方法有两种：

　　直接把API所需的认证信息置于URL里是最简单最方便的。

　　建议忽视这些方法，需要填写好多request的标准headers，太麻烦。

　　Headers设置：

　　只要填这一项就够了。

　　Body数据传送的各项参数：

　　Body的数据如图所示：

　　然后就可以点Send发送恳求了。

　　成功后，可以得到百度云返回的一个JSON数据，类似右图：

　　返回的是一行一行的辨识字符。百度云的识别率是相当高的，几乎100%吧。毕竟是国外本土的机器训练下来的。

　　API常用地址

　　以下是百度云的OCR常用API地址，每个API所需的参数都差不多，略有不同。所有的API和地址以及详尽所需的参数，参考官方文档，很简单。一个弄明白了就其他的都明白了。

　　API恳求地址调药量限制

　　通用文字辨识

　　50000次/天免费

　　通用文字辨识（含位置信息版）

　　500次/天免费

　　通用文字辨识（高精度版）

　　500次/天免费

　　通用文字辨识（高精度含位置版）

　　50次/天免费

　　网络图片文字辨识

　　500次/天免费

0

2020-08-23

文章采集api

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

一篇文章搞定百度OCR图片文字辨识API

0 个评论

发起人

AI时代内容工厂

一篇文章搞定百度OCR图片文字辨识API

0 个评论

发起人

相关问题