功能介绍
-
模型管理
支持展示所有模型列表,提供新建模型功能,可对模型进行导入导出操作,且每个模型可显示模板ID、模板名称、训练时间等模型详情
-
模型训练
自动/手动框选图片中文字及位置固定的内容,对模板图像进行自动分析,快速设定参考区和识别区,可对每个模型进行编辑、测试、发布、删除等操作,几分钟即可完成,正式发布后即可调用该模板
-
模型标注
自动进行全版面的分析与识别,训练时可以基于此结果标注参考区和识别区,可对模板图像进行旋转、放大、缩小、移动等操作
-
无框线/有框线明细表自动分析
可对无框线/有框线列表明细区域进行自动列分析,支持对自动分析的明细列进行增加、删除和修改,识别率高
-
平台内置丰富的识别核心
支持识别中文简体、手写、中文繁体、印刷混排样本、英文和数字,识别率高,用户可自行设置识别字段
-
自定义分类器
针对需要分类的企业独有格式文档,每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类
-
输出结构化数据
返回各类表单/卡证的JSON、XML结构化数据,方便编辑,实现电子和纸质文件信息即时同步
-
高级设置
可对每个识别区进行更多高级设置,包括行数限制、字符集限制、正则表达式限制,以提升识别率
-
关键字段信息智能抽取
支持在多行内容中抽取固定行或固定同一字段信息
-
字符替换
内置正则表达式,可对易出错文本进行校对并替换
-
复杂不规则样本模型训练
支持对复杂不规则样本模型(例如:药瓶瓶身说明书)进行识别训练
产品优势
-
智能滤色
- 可智能过滤样本中的红蓝色,提升识别率
-
内嵌多种成熟模型、可直接调用
- 内嵌传统证卡、票据等成熟模型,可直接选择使用,识别率高
-
灵活编辑、修改
- 如多次测试效果满意即可进行发布,如效果不满意可返回继续编辑
-
深度学习算法技术
- 倾斜、旋转、拍照畸变、背景、证件不全等复杂样本均可识别
-
支持识别多种文件格式图片
- 支持JPEG、PNG、PDF等多种文件格式上传,可支持拍照、扫描、打印、网银等多种获取形式的表单识别
-
私有化部署
- 支持私有化部署,部署至用户本地服务器,保障数据私密性
应用场景
- 银行票据识别
- 企业经营分析
- 医疗票据识别
- 卡证、文件电子化
-
银行票据识别
银行开户、信贷审批、后督等各类业务审批过程中,工作人员需要审查多种材料,时间跨度大、电子与纸质数据共通难,人工审阅、审批效率低。应用OCR训练平台,对业务凭证、申请书、回单、对账单、汇票、银行流水等常用银行票据进行模板制作,实现自动分类和结构化识别,可应用于银行开户、信贷、后督等场景,实现自动化信息提取,并智能录入到业务系统中,有效降低人力成本,控制业务风险。
-
企业经营分析
银行流水单是了解企业运营情况的重要依据,通过OCR训练平台,可实现多种版式银行流水信息的智能提取,辅助用户审核账户流水时段是否完整,便于分析、核查企业是否存在流水造假、虚构利润等情况,解决流水账户众多、版式难统一、数据获取难等问题。
-
医疗票据识别
应用OCR训练平台对检验报告单、门诊收费票据、住院收费票据等常用医疗票据进行模板制作,实现自动分类和结构化识别,可应用于医疗数据分析、医药费用报销、医疗票据电子化等场景,实现相关票据信息的自动识别和录入,有效降低人力成本,大幅度提升医疗信息化程度。
-
卡证、文件电子化
应用OCR训练平台对版式不统一的选票卡、准考证等各类卡证、文件进行结构化识别,实现各类卡证和文件的电子化管理,可应用于纸质文件分类归档、信息统计分析、关键内容提取等场景,有效降低人工录入成本,大幅度提升信息管理效率。