产品中心 表格OCR识别AI训练平台 表格OCR识别AI训练平台

功能介绍

模型管理

支持展示所有模型列表,提供新建模型功能,可对模型进行导入导出操作,且每个模型可显示模板ID、模板名称、训练时间等模型详情

模型训练

自动/手动框选图片中文字及位置固定的内容,对模板图像进行自动分析,快速设定参考区和识别区,可对每个模型进行编辑、测试、发布、删除等操作,几分钟即可完成,正式发布后即可调用该模板

模型标注

自动进行全版面的分析与识别,训练时可以基于此结果标注参考区和识别区,可对模板图像进行旋转、放大、缩小、移动等操作

无框线/有框线明细表自动分析

可对无框线/有框线列表明细区域进行自动列分析,支持对自动分析的明细列进行增加、删除和修改,识别率高

平台内置丰富的识别核心

支持识别中文简体、手写、中文繁体、印刷混排样本、英文和数字,识别率高,用户可自行设置识别字段

自定义分类器

针对需要分类的企业独有格式文档,每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类

输出结构化数据

返回各类表单/卡证的JSON、XML结构化数据,方便编辑,实现电子和纸质文件信息即时同步

高级设置

可对每个识别区进行更多高级设置,包括行数限制、字符集限制、正则表达式限制,以提升识别率

表格OCR识别AI训练平台,支持在多行内容中抽取固定行或固定同一字段信息
关键字段信息智能抽取

表格OCR识别AI训练平台,支持在多行内容中抽取固定行或固定同一字段信息

表单识别AI训练平台,内置正则表达式,可对易出错文本进行校对并替换
字符替换

内置正则表达式,可对易出错文本进行校对并替换

表单识别AI训练平台,支持对复杂不规则样本模型(例如:药瓶瓶身说明书)进行识别训练
复杂不规则样本模型训练

支持对复杂不规则样本模型(例如:药瓶瓶身说明书)进行识别训练

产品优势

表单识别AI训练平台,可智能过滤样本中的红蓝色,提升识别率
智能滤色
可智能过滤样本中的红蓝色,提升识别率
内嵌多种成熟模型、可直接调用
内嵌传统证卡、票据等成熟模型,可直接选择使用,识别率高
灵活编辑、修改
如多次测试效果满意即可进行发布,如效果不满意可返回继续编辑
深度学习算法技术
倾斜、旋转、拍照畸变、背景、证件不全等复杂样本均可识别
支持识别多种文件格式图片
支持JPEG、PNG、PDF等多种文件格式上传,可支持拍照、扫描、打印、网银等多种获取形式的表单识别
私有化部署
表格OCR识别支持私有化部署,部署至用户本地服务器,保障数据私密性

应用场景

  • 银行票据识别
  • 企业经营分析
  • 医疗票据识别
  • 卡证、文件电子化
银行票据识别

银行开户、信贷审批、后督等各类业务审批过程中,工作人员需要审查多种材料,时间跨度大、电子与纸质数据共通难,人工审阅、审批效率低。应用OCR训练平台,对业务凭证、申请书、回单、对账单、汇票、银行流水等常用银行票据进行模板制作,实现自动分类和结构化识别,可应用于银行开户、信贷、后督等场景,实现自动化信息提取,并智能录入到业务系统中,有效降低人力成本,控制业务风险。

企业经营分析

银行流水单是了解企业运营情况的重要依据,通过OCR训练平台,可实现多种版式银行流水信息的智能提取,辅助用户审核账户流水时段是否完整,便于分析、核查企业是否存在流水造假、虚构利润等情况,解决流水账户众多、版式难统一、数据获取难等问题。

医疗票据识别

应用OCR训练平台对检验报告单、门诊收费票据、住院收费票据等常用医疗票据进行模板制作,实现自动分类和结构化识别,可应用于医疗数据分析、医药费用报销、医疗票据电子化等场景,实现相关票据信息的自动识别和录入,有效降低人力成本,大幅度提升医疗信息化程度。

卡证、文件电子化

应用OCR训练平台对版式不统一的选票卡、准考证等各类卡证、文件进行结构化识别,实现各类卡证和文件的电子化管理,可应用于纸质文件分类归档、信息统计分析、关键内容提取等场景,有效降低人工录入成本,大幅度提升信息管理效率。

客户案例

表单识别AI训练平台赋能鑫方盛进出货管理
中安未来携手锦州银行,智能防范票据业务风险
盘点护照阅读器在银行中的八大应用!