文章采集组合工具(文章采集组合工具部分截图全部截图仅限于截取某单元格区域)

优采云 发布时间: 2022-04-01 04:02

  文章采集组合工具(文章采集组合工具部分截图全部截图仅限于截取某单元格区域)

  文章采集组合工具是将两个传统的、基于http协议的ocr文字识别工具集成到一起,基于此工具对截图中的文字进行识别,并得到准确的识别结果。

  1、下载软件打开采集软件,点击工具菜单,

  2、配置采集格式在文件选项中,将采集格式设置为web和本地gif图片,为了方便后续作图和压缩上传图片,对网址进行进一步压缩。再选择按需分段采集,再将采集包括的页数设置为最大限制即可设置完成后点击保存,点击下一步,

  3、设置分割参数由于截图中存在多张图片,格式一般是jpg和png,而生成的文件包括两部分,一部分是jpg格式的,另一部分是png格式的,格式会受屏幕分辨率、文件大小等因素影响,因此采集前需要将图片格式转换为jpg格式。点击工具菜单,选择转换格式,

  4、识别接下来,需要将识别完成的图片,通过javascript设置进行页面和正文内容的识别。点击工具菜单,选择javascript,

  5、识别完成,保存当前的图片本地识别完成后,将识别好的内容保存到本地,并下载到电脑,如下图所示:点击页面中的另存为,在弹出的保存选项卡中将图片保存到相应的位置,并生成压缩包如下图所示。

  全部采集组合工具部分截图界面截图全部截图部分截图截图仅限于截取某一单元格区域

  5、识别准确度自于采集组合工具的本身功能,检测jpg格式图片时,已经能够达到准确识别的结果,但是对于jpeg格式的图片,上传超出图片2-3倍大小时,对识别率影响较大,因此建议用户只将截取的图片达到checkbox处,而不要达到2-3倍大小。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线