利用XSL将DataSet数据转换为Excel文档

最近在一个ASP.NET项目的开发中有一个模块需要采用OWC控件呈现Excel样式的表格内容,表格内容比较复杂,包括锁定表头、公式、小计、合计、排序等。

以前采用客户端操作OWC实例一个单元格一个单元格的去写,那麻烦程度可想而知,于是便尝试采用新方法,利用XSL转换实现需要的功能。

经过几天一穷二白为基础的学习和摸索,总结出一点心得,还有一点疑问和未处理的问题,放在园子里,如果总结的有什么不正确的地方,还望大家指出。

我采用这种方法前,首先确认了一些限制条件的满足:

1、 在项目中可以统一使用MS Office 2003版本的OWC控件

2、 我们的客户都在使用MS Office 2003,这样这种做法也可以作为直接生成客户端Excel文档的方法

我的目标格式为以下Excel文档(部分):

利用XSL将DataSet数据转换为Excel文档_第1张图片

这个表的特点是:

1、 列数固定

2、 表头锁定

3、 每个部门的费用明细数量不定

4、 小计统计各个部门所属的费用金额之和

5、 合计统计所有部门所有费用的总金额

6、 小计和合计应该设为公式,这样在修改费用明细的时候,小计和合计可以即时反映变化

首先,需要在Excel里面做好一个模板,然后另存为“XML电子表格”,模板内容如下:

利用XSL将DataSet数据转换为Excel文档_第2张图片

这个模板包含了几乎所有需要的元素,包括单元格锁定、各种外观样式、行级别的公式设定(比如J4=I4-H4)、一行明细、一行小计、一行合计等一切可以在“设计时”确定的内容。

通过分析这个模板,我们观察到,完成这个模板的数据填充需要进行2层循环:

l 外层循环:需要针对每个部门进行循环,在循环之内填充每个部门的费用明细,并且为每个部门的小计进行公式设置

l 内层循环:在每个部门内,循环填充每个部门的费用明细

为了使用XSL简单起见,我们的DataSet就包含2个DataTable,第一个DataTable(命名为DepNames)包含需要填充的数据中的部门信息;第二个DataTable(命名为FeeDetail)包含所有需要填充的数据(包括部门标识和费用信息)。当然,从原则上来说,只需要第二个DataTable的数据就可以了,第一个DataTable中的数据完全可以通过XSL的某些操作得到,但是我没有查到如何通过XSL的某些操作可以达到Sql语句中类似SELECT DISTINCT SomeField FROM SomeTable的效果(那位大虾知道?),因此只能退而求其次。

DepNames表包含的信息如下:

DepCode         DepName

10101                A部门

10102                B部门

……                  ……

 

FeeDetail表包含的信息如下:

DepCode         FeeCode          ……

10101                550101     ……

10102                640101     ……

……                  ……                  ……

通过DataSet的GetXml()方法得到的XML文档格式如下:

< NewDataSet >
 
< DepNames >
    
< DepCode > 101010005 </ DepCode >
    
< DepName > 一个部门 </ DepName >
 
</ DepNames >
 
< DepNames >
    
< DepCode > 101010006 </ DepCode >
    
< DepName > 又一个部门 </ DepName >
 
</ DepNames >
 
< FeeDetail >
    
< DepCode > 101010005 </ DepCode >
    
< FeeCode > 66010102 </ FeeCode >
    
< FeeName > 一项费用 </ FeeName >
< ExamineAddUpMoney > 0.0000 </ ExamineAddUpMoney >
 
</ FeeDetail >
    
< FeeDetail >
    
< DepCode > 101010006 </ DepCode >
    
< FeeCode > 66010103 </ FeeCode >
    
< FeeName > 另一项费用 </ FeeName >
  
< ExamineAddUpMoney > 0.0000 </ ExamineAddUpMoney >
 
</ FeeDetail >
</ NewDataSet >



可见,得到的DataSet数据中,<NewDataSet>节点是DataSet的名称;<DepNames>节点和<FeeDetail>节点分别代表DepNames结果集的行数据和FeeDetail结果集的行数据,它们的子节点则代表每行的各列数据值。

XSL各种语法很丰富,不过通常我们只需要利用其中的一小部分就能达到我们的目的。下面我们来分析一下模板背后的XML文档格式。

Excel文件另存的XML文档,似乎很长,内容很复杂,但是,借助VS2005以及IE对XML文档中节点良好的“折叠”特性,我们可以很容易的分析出文档中的一些主要元素,另外MS也提供了MS Office 2003的XML Schema参考,对我们也有很大帮助。

我们主要需要关注XML文档中的<Worksheet ss:Name="WorksheetName">节点及其子节点,很明显,它代表Excel文档中的各个Worksheet,对于我们的文档,<Worksheet>节点中包含了一个<table>节点,样例如下:

< Table  ss:ExpandedColumnCount ="27"  ss:ExpandedRowCount ="6"  x:FullColumns ="1"
 x:FullRows
="1"  ss:DefaultColumnWidth ="54"  ss:DefaultRowHeight ="13.5" >

其中,我们主要需要关注2个属性:

l ExpandedColumnCount:代表Excel文档中的列数

l ExpandedRowCount:代表Excel文档中的行数

以上2个属性如果比文档中实际数据的行数和列数小,通常就会导致文档错误而无法用Excel打开,因此我们生成的文档,需要根据实际数据行数来更新ExpandedRowCount属性的值,或者把他们设置为一个非常大的数。

<Table>节点的子节点包括若干<Column>节点和<Row>节点,这很清楚代表表格中的行信息和列信息,对于我们这次的任务,只需要关心<Row>节点,一个简单的<Row>节点类似以下格式:

< Row >
         
< Cell  ss:StyleID ="s123" >
                   
< Data  ss:Type ="String" > 这是单元格的内容 </ Data >
         
</ Cell >
</ Row >

其中,<Cell>节点的ss:StyleID属性代表单元格的样式ID,引用Styles节点中的样式节点ID,<Data>节点的ss:Type属性代表单元格值的类型,可以是String(字符串)、Number(数值)、DateTime(日期)等类型。

我们找到样例中示例数据所在的<Row>节点,结合DataSet的结构并利用XSL循环语法完成2层循环操作:

< xsl:for-each  select ="//DepNames" >
         
< xsl:variable  name ="DepCode"  select ="DepCode"   />
         
< xsl:for-each  select ="//FeeDetail[DepCode=$DepCode]" >
                   
< xsl:sort  order ="ascending"  select ="FeeCode"   />  
                   
< Row  ss:AutoFitHeight ="0"  ss:Height ="11.25"  ss:StyleID ="s80" > <! —费用明细信息-- >
         
</ xsl:for-each >
         
< Row  ss:AutoFitHeight ="0"  ss:Height ="11.25"  ss:StyleID ="s80" ></ xsl:for-each > <! —费用小计-- >
</ xsl:for-each >
< Row  ss:AutoFitHeight ="0" > <! —费用合计-- >

以下对上面的语句逐一解释:

<xsl:for-each select="//DepNames">:

外层循环,选取DataSet中的所有DepNames节点进行循环,也就是说对每一个部门进行循环

<xsl:variable name="DepCode" select="DepCode" />:

声明一个变量,这个变量存放第一层循环中的当前行的部门编码,用以控制第二层循环只获取当前部门所属的费用

<xsl:for-each select="//FeeDetail[DepCode=$DepCode]">:

内层循环,选取DataSet中部门编码为第一层循环当前部门编码的费用明细项进行循环,注意表达这种意思的XPath语法,其中$DepCode即为我们上面所定义的那个变量

<xsl:sort order="ascending" select="FeeCode" />:

对选取的费用明细按照费用编码排序

<Row ss:AutoFitHeight="0" ss:Height="11.25" ss:StyleID="s80"><!—费用明细信息à:

这是费用明细行,下面会说明<Row>的子节点(单元格)的填充。

</xsl:for-each>:

内层循环结束

<Row ss:AutoFitHeight="0" ss:Height="11.25" ss:StyleID="s80"></xsl:for-each><!—费用小计à:

费用小计行,后面会说明费用小计的单元格如何填充

</xsl:for-each>:

外层循环结束

<Row ss:AutoFitHeight="0"><!—费用合计à:

最后的费用合计

 

通过上面的2层循环框架,我们可以得到需要的结果格式。下面,我们简单说明一下费用明细和费用小计的<Row>节点的填充。

<Row>节点的填充比较简单,利用XSL的value-of语法取代模板中的示例值将DataSet中的内容直接填充上去就可以了:

< Cell  ss:StyleID ="s81" >
 
< Data  ss:Type ="Number" >
 
< xsl:value-of  select ="BudgetYear"   />   <! —填充了预算年度-- >
 
</ Data >
</ Cell >

其中select属性的内容是相对于循环所在的当前节点的相对路径。

这里主要需要说明的是对Excel中公式的处理。由于我们的Excel行数不定,因此小计和合计不能简单地写一个固定的公式就能搞定,有一定动态性、相对性。

好在Excel的公式描述形式就是动态的(当然,利用绝对单元格引用的公式除外)。我们来看一个简单的公式:

<Cell ss:StyleID="s82" ss:Formula="=Sum(RC[-2]:RC[-1])"></Cell>

公式中,单元格是以R[X]C[X]的形式标识的,其中,R和C代表行(Row)和列(Column),而中括号中的数字则代表相对于当前单元格的目标单元格的位置,

比如RC[-2]代表这样一个单元格:与当前单元格在同一行,列在当前单元格所在列的前2列的那个单元格。

我们首先应该考虑如何描述费用小计的公式,然后把我们的描述转化为具体的公式。

我们可以这样描述我们的费用小计共识:费用小计=对 当前单元格的上一单元格 与 当前单元格的上费用明细个数个单元格 的求和。

其中费用明细个数,是指费用小计所属的部门下的费用明细个数。

然后我们可以将它转化为以下XSL描述:

< Cell  ss:StyleID ="s84" >
 
< xsl:attribute  name ="ss:Formula" >
 =SUM(R[-1]C:R[- 
 
< xsl:value-of  select ="count(//FeeDetail[DepCode=$DepCode])"   />  
 ]C) 
 
</ xsl:attribute >
 
< Data  ss:Type ="Number" >
 
< xsl:value-of  select ="sum(//FeeDetail[DepCode=$DepCode]/ApAddUpMoney)"   />  
 
</ Data >
 
</ Cell >

注意XSL中为一个节点追加属性的做法,通过<xsl: attribute>来实现

 对于合计,公式比较难设,本来没想到什么很好的办法,不过我一个同事提到了,可以将所有数据行(包括费用明细和费用小计行)求和然后除以2,就差不多能达到效果,这是个不错的注意,真是数学高手,头脑够灵活,佩服,佩服……具体我就不写了。

 点击这里下载本文所说的完整的xsl文件

由于时间有限,文章写得有一种虎头蛇尾的感觉,望大家见谅 :)

你可能感兴趣的:(Excel)