- TH-OCR文字识别SDK
- IT-Scan文档扫描王
- 数据录入工厂
- OCR文字识别系统(信创版)
功能介绍
-
识别语种多
数据录入工厂支持识别中文(简体、繁体),手写体、纯英文、日文、韩文等多门语种
-
版面分析
数据录入工厂可对杂志、书本、报刊等进行自动版面分析。将版面分为横排文本、竖排文本、图像、表格四种类型,提高识别效果,用户也可手动版面分析
-
强大的图像处理功能
支持图像旋转、删除区域、图像裁剪、倾斜校正等多种图像处理,自动对倾斜图像等不规则图像进行校正,增强图像质量,提高识别率
-
横向校对
将识别的原始图像块跟踪显示在识别结果上,使识别结果与原始图像一一对应的显示,方便修改错误,直观、方便、快捷
-
纵向校对
重新组织文字顺序,将识别结果相同的文字对应的图像显示在一起,不易遗漏错字,校对效率高,不易疲劳
-
增量识别
允许用户只识别新增或手工编辑修改过的区域,保留其他已经完成校对的区域
-
版面还原
通过还原字体、字号、版面位置、字体颜色等信息,生成优质的全息PDF文档,将识别后的报刊、杂志、图书等多种形式的文档以原版原式呈现在读者面前
-
自学习
针对古籍等特殊领域文档中经常出现的文字,通过自学习功能,可支持这些文字的识别
-
多种格式导入和导出
支持TIF、BMP、JPG、PDF等多种图像格式文件的导入识别,识别结果经修改编辑后,可根据用户需求需要将文档存为可检索的RTF、双层PDF、TXT格式文档
-
支持多种采集方式
支持通过连接扫描仪扫描文件、导入本地或者网络文件夹中图像文件等多种图像采集方式
产品优势
-
应用软件
- 不需二次开发集成,识别结果直接应用
-
识别准确率高
- 自有行业OCR识别引擎,中文汉字识别率达99%以上
-
双层PDF批量制作
- 数据录入工厂可将指定文件内的图像批量转化为双层可检索PDF
-
自动调整区域边界
- 数据录入工厂可以自动调整黑白二值的图像区域,使图像自动适应区域边界
-
遗漏检查
- 当识别页面较多、较复杂时,可自动检查是否有页面没有进行版面分析
-
智能修改矫正
- 可在一个统一的平台下,同时识别和校对修改中文、日文、韩文、英文等多种文字
-
智能识别
- 在线可识别字在原文中的位置和大小,可识别多页PDF文件
-
应用范围广
- 国家知识产权局、地质勘察局等,均将中安未来文字识别集成到企业系统中应用
应用场景
- 图书馆
- 出版社
- 系统办公软件
- 档案数字化加工
- 合同管理
-
图书馆
随着信息社会的飞速发展,建立新型数字图书馆的需求迫在眉睫,数字图书馆建设成为国家关注的重点项目,如何低成本、快速度、高质量地将我国浩如烟海,取之不竭的文档资料和行业信息数字化?中安未来数据录入工厂,智能生成优质的全息PDF文档,最大程度还原图书,可以全方位实现与图书馆数据立体链结,帮助图书馆实现信息数字化。
-
出版社
目前,我国的信息产业,面临着电子出版、Internet网上出版的新型发展。我国现有常见报刊3000余种,各类杂志4500余种,报刊、杂志的电子出版已经成为媒体潮流和竞争的热点,中安未来自有行业OCR引擎,中文汉字识别率达99.8%以上,智能生成优质的全息PDF文档,最大程度还原图书,输出可编辑的文件,方便出版社实现电子化出版。
-
系统办公软件
OA软件办公系统必不可以少的一个软件工具,将中安未来OCR识别嵌入到OA办公软件中,与OA软件一同安装在客户端上,为终端使用客户提供公文或者内部资料的文字提取工作,提升整体的工作效率、节约人力成本,操作便捷。
-
档案数字化加工
将中安未来OCR文字识别系统与信息化服务系统、智慧办公系统、档案数字化系统对接,应用于大量数据档案的管理与数字化场景,通过扫描企业纸质档案,可导出双层PDF、TXT、WORD、XML、XLS等格式文件,方便企业编辑、查找档案信息,实现档案数字化管理,提升效率和智能化水平。
-
合同管理
合同比对基于OCR智能识别技术,自动识别合同中的文本信息,自动抽取合同文本中的关键信息,可识别字在原文中的位置和大小,将图像识别输出为可编辑的文件格式,进行存储实现计算机替代人工审核比对,解决合同管理工作中人工审核时间成本高、人力成本高的难题。