智能识别,一键采集(AI+OCR,识别不惧强干扰传统的OCR识别场景)
优采云 发布时间: 2021-11-19 17:05智能识别,一键采集(AI+OCR,识别不惧强干扰传统的OCR识别场景)
在金融领域,纸质文档是最常用的信息载体,需要输入大量的图文信息。由于行业的特殊性,文件、票据、许可证的种类复杂多变。图像信息的人工分类和录入会消耗大量的人力、物力和时间成本,严重影响业务流程的效率和用户体验。
文思海辉金融依托AI+OCR技术,为银行、保险、证券等领域打造智能字符识别系统(简称ICR系统)。解决金融机构不同应用场景的字符识别和结构化输出。、快速适应培训等业务痛点。
“AI+OCR”,识别无惧强干扰
在传统的OCR识别场景中,普遍的难点在于环境干扰的处理和优化,例如印刷品上的文字压线、污迹等,可能会导致识别结果不正确。文思海辉的ICR系统在认可过程中充分考虑了这些因素。可以对识别出的物体图像进行预处理,利用自主研发的AI干扰检测模型进行识别和去除。可以保证在强干扰下最大可能的识别内容。准确性。系统涵盖300多种常用中英文字体,训练样本量820万。英文字符识别准确率99%以上,汉字识别准确率95%以上,大大完善了金融机构的各种*敏*感*词*。,票证识别的准确性为下游业务系统使用识别信息提供了效率和准确性的双重保证。
确保信息结构化输出的标记工具
金融行业由于其特殊性,需要在识别文档中的字符的同时实现识别结果的结构化输出,以满足各种内部业务系统的需求。这就对识别内容的结构化输出能力提出了更高的要求。
文思海辉金融ICR系统收录多种模型(如字符识别模型、文本定位模型),可独立离线部署,并提供模板标注工具,包括文档模板标注、文档分类特征标注、文档分类、文档字段提取、NLP A包括校准在内的一系列参数管理功能,方便用户根据自身应用场景进行适配,支持自定义新模板并标注,用户只需在系统参数中上传模板文档,设置需要的字段和字段需要结构化。Columns可以通过简单的注释快速实现新模板的结构化提取功能。
支持多种业务场景识别
• 开户业务
ICR系统可以准确识别各类*敏*感*词*件,自动提取结构化信息,在用户注册过程中快速完成*敏*感*词*、护照、银行卡等*敏*感*词*的识别和录入,大大提升了用户体验。
• 贸易金融
支持贸易金融业务常用单证识别,如国际汇款业务单证识别、出口谈判/交单常用单证识别等,并提供智能单证审核功能。智能文档审核系统收到ICR识别的结构化数据后,对其进行智能审核,形成审核意见和结论,反馈给文档操作者参考或确认。
• 商业合同
支持业务合同信息识别和智能结构化提取,包括合同标的、风险条款、合同金额等业务要素信息,秒级完成自动定位、切割、分类、识别、输出。是金融机构及各类企业快速办理合同审查的好帮手。
• 财务报表
系统可自动判断财务报表类型,读取报表数据,智能匹配用户自定义需要识别的位置、栏目、模板,并以标准化、模块化的形式展示识别结果,提高数据质量< @采集 系统的效率和准确性解决了自动灌装系统的问题。
此外,文思海辉的ICR系统还支持对各种业务单据/凭证的印章提取和识别,并支持*敏*感*词*和打印比对、*敏*感*词**敏*感*词*批量识别、结构化提取和比对服务。还可以根据用户特定业务场景的定制开发,依托敏捷开发方式和“AI+OCR”技术,全面提升金融机构文件、合同、牌照的识别准确率和结构化输出能力。
2019年,中国人民银行印发了《金融科技发展规划(2019-2021年)》。“人工智能”已被多次提及,其重要性可见一斑。未来,文思海辉金融将继续专注于金融场景的探索,结合自身的技术实力,帮助金融机构加速创新、优化运营、助推增长、升级体验,实*敏*感*词*融和场景创新。