产品中心 文档票据OCR识别 数据录入工厂
  • TH-OCR文字识别SDK
  • IT-Scan文档扫描王
  • 数据录入工厂
  • OCR文字识别系统(信创版)

功能介绍

识别语种多

数据录入工厂支持识别中文(简体、繁体),手写体、纯英文、日文、韩文等多门语种

版面分析

 数据录入工厂可对杂志、书本、报刊等进行自动版面分析。将版面分为横排文本、竖排文本、图像、表格四种类型,提高识别效果,用户也可手动版面分析

强大的图像处理功能

支持图像旋转、删除区域、图像裁剪、倾斜校正等多种图像处理,自动对倾斜图像等不规则图像进行校正,增强图像质量,提高识别率

横向校对

将识别的原始图像块跟踪显示在识别结果上,使识别结果与原始图像一一对应的显示,方便修改错误,直观、方便、快捷

纵向校对

重新组织文字顺序,将识别结果相同的文字对应的图像显示在一起,不易遗漏错字,校对效率高,不易疲劳

增量识别

允许用户只识别新增或手工编辑修改过的区域,保留其他已经完成校对的区域

版面还原

通过还原字体、字号、版面位置、字体颜色等信息,生成优质的全息PDF文档,将识别后的报刊、杂志、图书等多种形式的文档以原版原式呈现在读者面前

自学习

针对古籍等特殊领域文档中经常出现的文字,通过自学习功能,可支持这些文字的识别

多种格式导入和导出

支持TIF、BMP、JPG、PDF等多种图像格式文件的导入识别,识别结果经修改编辑后,可根据用户需求需要将文档存为可检索的RTF、双层PDF、TXT格式文档

支持多种采集方式

支持通过连接扫描仪扫描文件、导入本地或者网络文件夹中图像文件等多种图像采集方式

产品优势

应用软件
不需二次开发集成,识别结果直接应用
识别准确率高
自有行业OCR识别引擎,中文汉字识别率达99%以上
双层PDF批量制作
数据录入工厂可将指定文件内的图像批量转化为双层可检索PDF
自动调整区域边界
数据录入工厂可以自动调整黑白二值的图像区域,使图像自动适应区域边界
遗漏检查
当识别页面较多、较复杂时,可自动检查是否有页面没有进行版面分析
智能修改矫正
可在一个统一的平台下,同时识别和校对修改中文、日文、韩文、英文等多种文字
智能识别
在线可识别字在原文中的位置和大小,可识别多页PDF文件
应用范围广
国家知识产权局、地质勘察局等,均将中安未来文字识别集成到企业系统中应用

应用场景

  • 图书馆
  • 出版社
  • 系统办公软件
  • 档案数字化加工
  • 合同管理
图书馆

随着信息社会的飞速发展,建立新型数字图书馆的需求迫在眉睫,数字图书馆建设成为国家关注的重点项目,如何低成本、快速度、高质量地将我国浩如烟海,取之不竭的文档资料和行业信息数字化?中安未来数据录入工厂,智能生成优质的全息PDF文档,最大程度还原图书,可以全方位实现与图书馆数据立体链结,帮助图书馆实现信息数字化。

出版社

目前,我国的信息产业,面临着电子出版、Internet网上出版的新型发展。我国现有常见报刊3000余种,各类杂志4500余种,报刊、杂志的电子出版已经成为媒体潮流和竞争的热点,中安未来自有行业OCR引擎,中文汉字识别率达99.8%以上,智能生成优质的全息PDF文档,最大程度还原图书,输出可编辑的文件,方便出版社实现电子化出版。

系统办公软件

OA软件办公系统必不可以少的一个软件工具,将中安未来OCR识别嵌入到OA办公软件中,与OA软件一同安装在客户端上,为终端使用客户提供公文或者内部资料的文字提取工作,提升整体的工作效率、节约人力成本,操作便捷。

档案数字化加工

将中安未来OCR文字识别系统与信息化服务系统、智慧办公系统、档案数字化系统对接,应用于大量数据档案的管理与数字化场景,通过扫描企业纸质档案,可导出双层PDF、TXT、WORD、XML、XLS等格式文件,方便企业编辑、查找档案信息,实现档案数字化管理,提升效率和智能化水平。

合同管理

合同比对基于OCR智能识别技术,自动识别合同中的文本信息,自动抽取合同文本中的关键信息,可识别字在原文中的位置和大小,将图像识别输出为可编辑的文件格式,进行存储实现计算机替代人工审核比对,解决合同管理工作中人工审核时间成本高、人力成本高的难题。

客户案例

OCR识别私有云服务,驱动数字化转型
OCR文字识别,提高快递行业分拣效率
OCR文字识别系统,助力档案数字化管理