云南昆明档案扫描数字化加工

档案数据处理

数据加工的文件格式文字格式:TXT、DOC、RTF、XML、HTML、Excel数据表、Access数据库等;图像格式:TIF、JPG、BMP、GIF、PDF、DJVU、CEB等;电子书格式:双层PDF、双层DJVU、双层CEB、OEB、EPUB、

汉大科技专注档案,致力于电子档案管理领域的研究和实践,业务范围包括:标准化档案管理软件与行业档案管理软件定制开发与服务;档案规范化服务(制度建设、档案整理);档案数字化加工及服务;数字化档案增值服务;无纸化病案归档等五大领域。

 数据加工的文件格式


文字格式:TXT、DOC、RTF、XML、HTML、Excel数据表、Access数据库等;图像格式:TIF、JPG、BMP、GIF、PDF、DJVU、CEB等;电子书格式:双层PDF、双层DJVU、双层CEB、OEB、EPUB、XML、HTML网页格式等。


数据加工的质量保障 


★保障体系:OCR智能识别、人工一二三校、人机结合对比校方式保障数据质量的万无一失;


★文字录入:错误率控制在千分之三以内,外校质量可控制在万分之三或万分之一,根据客户要求而制定;


★扫描识别:图书、期刊、报纸、文档等印刷品错误率控制在万分之三或万分之一,根据客户要求而制定;


★原样录入:质量控制在五万分之一、十万分之一乃至零,根据客户要求而制定。


数据加工流程


1.图像扫描:


采用科技光学仪器对数据进行扫描,生成TIFF、JPG、PDF等图像文件。


2.图像处理:


对扫描后的图像进行纠偏、去黑边、分页、拼图等处理,更高的还原原图像。


3.影象输入:


将通过扫描仪等光学仪器扫描并已人工处理过的图像链接到OCR软件中,我们所用的先进扫描仪等硬件设备使影像更清晰、扫描的质量更增进OCR处理的效率。


4.图像分析:


利用OCR对图像进行版面分析,比如文字的横向纵向、图片与表格等进行进行区分处理。


5.文字识别:


将分析好的图像OCR进行智能识别并进行人工校对(可先进行纵校再横校),保证质量减少错误率。


6.结果输出:


经过人工的一二三校,将数据按客户要求的格式输出并根据不同要求排版处理等。


上一篇:档案数字化加工外包
下一篇:档案整理