一、产品简介:
表格、票据自动识别SDK是一种通用的数据批量采集技术,适用于采集具有表格特征的表单、问卷、票据的数据,通过扫描、图像处理、自动分类、OCR(光学字符识别)技术,将表格图像中的数据信息准确、快速、真实地提取并保存,数据结果可导出为标准的数据格式,如Excel表、XML文件,与企事业单位的ERP、CRM等系统实现无缝结合。系统支持中英文、数字、符号等多类型字符的手写体、印刷体识别。
二、应用背景:
表格是一种高度精炼,集中的信息表达手段,纸质表格被广泛的应用于数据采集,将纸质表格数据转换成电子数据是信息化必然趋势。传统的人工数据录入方式效率低下、差错率高、成本昂贵,北京文通科技结合其在OCR(光学字符识别)领域的尖端技术,为客户提供企业级的数据采集方案,在数据采集和数据应用之间架起高速通道。
三、SDK概述:
3.1工作流程概述
3.2 SDK识别性能参数:
识别字符类型
印刷体:中文(简繁体)、英文、数字
手写体:中文(简繁体)、英文、数字
符号类:标识码、条码、 CheckBox、√、▇、○、●等,可定制符号
识别速度
单张表格的平均识别速度在1.0秒钟左右;
识别率
对于版面整洁的印刷字符的识别,正确率达99.96%
对于规范手写数字、英文的识别,正确率达98.5%
对于规范手写汉字的识别,正确率在 85%左右;
3.3 SDK主要模块及功能特点:
表格模板编辑器:轻松快速定义识别模板;
图像预处理模块:自动去黑边、自动纠偏、去噪声、图像自动旋转、多种二值化方法处理;
表格自动分类:系统能自动区分当前表格、票据的业务类别,实现全自动归档;
字符识别引擎:支持识别丰富的文字、符号类型;
快速校对工具:集字校对器、横向校对器
3.4 SDK开发环境
计算机性能:CPU-2.0GHz,内存-512MB,硬盘-2G;
操作系统:Win98/Win 2000/Win XP/2003 Server/vista/2008 Server/Win 7;
API接口:以标准的DLL(动态链接库)、OCX控件方式提供,支持VB、C#、Delphi、PB、 C/C++/VC++、Java等常用程序语言的调用;
四、我们的技术服务:
我们的宗旨是为客户提供企业级的数据采集技术,我们的技术服务内容包括识别需求评估、表格规范设计、模板定制、二次开发技术支持,在企事业客户开发应用系统的过程中,我们将全程跟踪,为客户方提供专业团队的技术服务。