Open XML学习总结

一、Office Open XML 概述

   office open xml是一种新的文件格式,是微软office2007以后的新的文件储存格式,较之以前的二进制储存格式,它有很多优点,1融合zip压缩技术,使得占有更小的存储空间;2即时部分文件损坏也不妨碍其它文件的获取。

二、Office Open XML使用步骤

首先,下载并安装OpenXMLSDKv2.msiOpenXMLSDKTool.msi,.

然后,打开vs201创建项目后,添加两个引用,一个是DocumentFormat.OpenXml;一个是WindowBase(它是.netframework 3.0部分)提供package类创建新软件software包,接下来必须在该软件Software包内创建一个或者多个部件,并在这些部件中写入任何所需内容若果只是简单的docx文件则只需对..\word\document.xml统资源标示符(Uri)创建部件,然后将WordprocessingML写入到该部件。

若是需要对openxml文件进行操作,则需要添加对应名空间,比如,word的话是添加DocumentFormat.OpenXml.Wordprocessing;excel 的话是添加DocumentFormat.OpenXml.Spreadsheet.DocumentFormat.OpenXml;DocumentFormat.OpenXml.Packaging;DocumentFormat.OpenXml.Wordprocessing;

三、Open XML格式文档结构

 1开放数据包约定/_rels/.rels

OPC(开放数据包约定),open xml文档实际上就是一个开放的数据包,里面包含各个部件,各个部件与数据包之间,通过显示关系(由uri命名的)进行关联,并且,每一个显示关系有一个id(以允许内容的部件引用该关系)和一个类型(以允许应用程序决定处理该关系的方式

2、WordprocessingML

WordprocessingML 文档由文章集合组成.

每个文章是以下类型之一: 主文档、词汇表文档、子文档、页眉、页脚 、注释 、

框架、文本框 、脚注 、 或尾注 。

唯一需要的文章是主文档。它是数据包关系的目标,其类型为:

http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument

从根目录到 XML 树中叶目录的典型路径包含以下这些 XML 元素

document:主文档的根元素;body:主体;p:段落;r:片;t:文本范围

3PresentionML

PresentationML 文档由演示文稿部件描述。演示文稿部件是数据包关系的目标,其类型为:http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument

4、SpreadSheetML

SpreadsheetML文档由工作簿部件在顶层描述。工作簿部件是数据包关系的目标,其类型为:http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument

5、支持的标记语言

 DrawingML :用于表示文档中的图形和其他以图形方式呈现的对象。

 VML :矢量图形的格式,包括它是为了保证向后兼容性,它将逐渐被DrawingML 取代。

 共享 ML:数学、元数据、自定义 XML  和书目 。

四、基本用例

是通过Openxml 进行对word,excel,ppt进行操作

针对word,可以进行批处理,比如根据关键字查找所有指定*docx类型文档,然后可以对文档内容进行操作,隐藏批注,更改样式,插入表格。或者替换文本。

针对excel,可对其进行根据sheet名称得到指定sheet对里面内容进行操作,之后再整合到一个excel中

针对ppt,可对ppt进行重新排序、插入新幻灯片、删除指定幻灯片、将主题应用与幻灯片等。

五、学习心得

通过一周的对office open xml的学习,我获益匪浅。不仅了解到什么是office Open xml,更加学会了如何去使用office open xml sdk,去对office文档进行操作。相信这会给以后的工作带来更大便利。学习是个细致,循序渐进的过程。

你可能感兴趣的:(Open XML学习总结)