文件文档数字化

当前,随着信息技术的飞速发展和互联网络的无限延伸,数字化、网络化、信息化已深刻地影响了人们的工作、学习、生活和娱乐,数字不再只和计算有关,更使人的生存方式发生了巨变,我们已不可逆转地进入了大数据时代。纵观档案发展史,从简牍到电子,档案工作无不是适应科技发展而不断更新档案管理内容和手段才获取更大发展的。面对大数据时代的机遇与挑战,我们有义务全面推进数字档案馆(室)建设和发展。

    大数据时代在不断改造传统产业的同时,也对传统档案管理模式提出了挑战。在数字信息技术环境下,电子载体和数字传播方式的异军突起,信息处理方式的变革,电子文件的爆炸式增长,使得档案的传统载体形态开始向数字形态过渡,档案管理和利用的主要环境逐渐向电子环境迁移。传统档案馆(室)必须向数字档案馆(室)转变,才能适应档案环境的新变化,开拓档案工作的新局面。

    在此背景之下国内的一些科技公司也推出了相应的产品和服务。对比传统的手工录入,OCR(光学字符识别)在资料文件电子化的识别和录入中具有巨大优势。在影像资料的识别过程中,OCR技术将图片进行二值化、噪点和干扰因素去除、页面旋转、倾斜较正、版面分析等处理,获得清晰端正的影像,再对影像文件进行字符切割、字符识别和版面恢复,输出与原始文件内容和版面一致的电子文件。

  扫描识别系统依托清华TH-OCR技术优秀的捕获算法,能实现大批量影像资料的精准、快速识别。同时,OCR支持识别中、英、日、韩、俄、意大利、阿拉伯等多国文字及维吾尔文,能轻松识别中英、日英、韩英等混合排版识别,满足了金融机构国际结算业务中多语种纸质支付文件的识别要求。

你可能感兴趣的:(文件文档数字化)