[ChneChen的技术文档] [办公自动化应用]人工智能在公文处理中的广泛应用

人工智能在公文处理中的广泛应用

ChneChen  写于2018年12月8日星期六中午,首发于CSDN,入门级教材,给基层文字处理人员。

 

本文目的:在公文处理过程中,实现DOC格式纸质文件(即:word对应的文档格式文件)的再编辑,将有效的提高工作效率,本文将以实例介绍一套成熟的公文电子化处理方案。

 

操作流程:

1.将DOC格式纸质文件转为PDF格式电子文件,其目的是通过扫描软件实现DOC格式纸质文件的电子存档。

人工智能处理的首要环节为实现纸质文件的电子化,依托扫描软件可轻松实现此项操作(需要注意的是扫描的分辨率不能过低以影响效果),但纸质文件转换为电子文件后,选择储存为特定类型的电子文件尤为重要。传统的扫描文件多以图片格式(如jpg、gif、itff等)保存,但在公文处理过程中,图片格式文件并不适用,图片格式文件优势在于清晰,但文件过大不利于快速传输,正因为如此PDF格式文件应运而生,PDF格式中文名为可移植文档格式,从文件名就可以理解其作用,与图片格式文件相比,PDF格式文件优点主要有包括一是文件占有空间小,特别有利于通过电子邮件等方式快速传输,二是所见即所得,直接打印不变形,直接打印后可完全还原DOC类型纸质文件模样。上述两大优点正是在实现DOC类型纸质文件的电子存档及转换处理过程中,摒弃图片格式文件选择PDF格式文件的关键所在。

 

2.将PDF格式电子文件转为DOC格式电子文件,其目的是通过OCR软件实现PDF格式电子文件的再编辑。

传输不是最终目的,人工智能的核心在于再编辑,这样才可以有效解放劳力。实现再编辑则需要依托OCR软件,OCR中文名光学字符识别,国产的本人用过汉王的尚书和清华紫光等多系列,总的来说尚书系列不错,从4号到8号一路走来都有进步,当然现在强烈推荐的是ABBYY  FineReader,来自俄罗斯的神器,外号OCR中的奔驰,其显著特点包括全中文、一键识别、三号字体识别率高达99.9%、界面友好、操作简单等,本人测试ABBYY  FineReader 11(最新版本大概是ABBYY FineReader 14)后完全摒弃了国产软件,有兴趣的朋友请自行实测效果。

 

3.将DOC格式电子文件转为PDF格式电子文件,其目的是通过虚拟打印软件实现DOC格式电子文件的再传输。

通过一、二步的操作,完全实现了DOC格式纸质文件的再编辑,已经实现了很多人所要求的纸质公文电子化处理,第三步的操作似乎已没必要,其实不然,真正成熟的公文电子化处理在于完全摒弃纸质。受方方面面的制约,国内大多数人现在所使用的公文电子化其实是一种半自动化,即电子+纸质模式,当然半自动也不错,毕竟是一种进步,我们所能做的,就是尽量实现电子化在半自动化过程中所占的比重,从而更好的释放劳力。受操作系统影响,DOC类型电子文件在不同类型的终端(电脑和手机)显示过程中会出现偏差,特别是图文混排文件,即便同一类型的终端,字体库不全时显示效果亦有不同,为完全实现所见即所得,显示效果不变形,有时就需要将DOC格式电子文件转化为PDF格式电子文件进行传输,此时需要用到PDF虚拟打印机,顾名思义,打印机的作用在于将DOC格式电子文件打印为纸质文件,PDF虚拟打印机的作用在于将DOC格式电子文件打印为PDF格式电子文件(其实质是通过类似打印操作实现格式的另存为),可实现PDF虚拟打印的软件很多,常用的如PDF Creator,本人推荐使用Adobe Acrobat DC, Adobe Acrobat DC其实就是我们常用阅读DPF格式文件的软件Adobe Reader的专业版,其自带的Adobe PDF就可以轻松实现PDF虚拟打印效果。当然Adobe Acrobat DC功能无比强大,实现PDF虚拟打印只是其中一个附带部分功能,Adobe Acrobat DC最主要的目的是直接实现了对DPF文件的编辑、页面删除、拆分合并等等操作,要不怎么叫专业版呢,这里可能有的朋友就不明白了,为什么Adobe Acrobat DC可以直接对PDF文件进行编辑等各种功能而别的软件则需要进行识别转换才可以操作,普及一点知识,DPF格式文件为Adobe公司设计推出,Adobe公司同时设计推出了阅读DPF格式文件的软件Adobe Reader和它的专业版Adobe Acrobat DC,普通版免费使用,专业版则需要出钱购买。同一个公司的产品,不存在接口问题,所以可以轻松转换编辑,其他公司的软件没有接口,自然无法直接编辑,只能通过转换格式实现再编辑(要都能直接编辑了,那Adobe Acrobat DC怎么卖钱呢)。商品都是逐利的,Adobe公司设计开发DPF格式文件就是为了赚钱,当然在赚钱的同时也极大的推进了电子化进程,伟大的公司都一样,赚钱-》做贡献-》赚大钱-》做更大的贡献,周而复始。伟大的人物则不一定相同,相比比尔.盖茨和史蒂夫.乔布斯,万维网(互联网前身)发明者蒂姆.博纳斯.李经济上异常贫乏,linux系统(安卓手机内核基础)的创始人林纳斯.托瓦兹也不是亿万富翁,但他们都应该受人敬仰,是他们推动科技改变了这个世界。

 

本文综述:纸质文档-》通过扫描软件-》转换为电子资料-》通过OCR软件-》识别为可编辑的电子文档-》编辑修改-》生成新的纸质文档。在从纸质文档到再次生成新的纸质文档过程中,人工智能软件发挥了重要作用,极大的提高了工作效率。

你可能感兴趣的:(【计算机技术类】其它/未分类)