在06年开发基于Window CE的嵌入式组态软件时就曾遇到序列化问题,由于程序运行在Window CE平台,其上的.Net Compact Framework仅支持XML序列化,而XML序列化不仅序列化后的体积较大,而且执行时间较长(参见我以前写的文章:嵌入式组态环境升级及XML反序列化慢的困惑、如何加速XML反序列化(精简框架集2.0SP1,WinCE4.2))。
而当时支持.Net Compact Framework的二进制序列化就是CompactFormatter(参见黎波的文章: 在.NET Compact Framework 2.0 中使用序列化)了,由于是第三方所开发,功能上尚不完善,故没有选用。
前段时间看MSN Direct代码,发现使用.Net Micro Framework二进制序列化后的广播数据比较小,并且速度快。所以想办法把相关代码做了平台移植,可没有想到的是在.net micro Framework和.Net Framework中都可以正常运行的代码,在.NET Compact Framework中竟然不能运行(主要是对Assembly操作的相关函数支持不够)。
由于目前在.Net Compact Framework开发的应用逐渐增多,并且最近也打算升级原先开发的嵌入式组态软件,经过再三考虑决定自行开发支持精简框架集的二进制序列化(说明:.Net Micro Framework平台上的二进制序列化,由于运行在ARM系列的CPU上,会考虑一些大小端的问题,所以多于一个byte的值变量都要进行特殊处理,速度相对较慢,不过.Net Micro Framework二进制序列化的优点是,支持bit序列化(bool变量按位存取,也可以为其它变量指定位数),所以它的序列化结果是最精简的)。
有.Net Micro Framework二进制序列化代码做参考,所以自行开发一个支持精简框架集二进制序列化库,并不是一件特别繁杂和痛苦的事:-)
在开发二进制序列化之前,对要完成的二进制序列化库,有以下几方面的考虑:
一、速度要快;
二、体积要小;
三、要支持自定义序列化;
针对第一点,故舍弃了.Net Micro Framework二进制序列化的bit序列化支持,并且精简了一些功能,比如仅支持原生数据类型的一维数组序列化,仅支持ArrayList,不支持泛型,此外不自行反射Assembly中的Type,和.Net Compact Framework 的XML序列化一样,需要开发者从外部传入Type列表;
针对第二点采用了很多.Net Micro Framework的二进制序列化思想,如序列化后的数据中不保存Type 的完整的名字,仅保存该名字的4个字节的哈希值,字符串的长度和数组长度用变长的1~4个字节的空间来保存,多个对象引用相同,仅保存首个对象等等;
而第三点主要和我开发的嵌入式组态功能相关,大量的图元派生于基类图元,而基类中的大量属性,在不同的图元中用到的都不同,如果一概而论全部序列化,则结果会比较大,而采用自定义序列化就能很好地解决这个问题。此外值得一提的是.Net Micro Framework二进制序列化和.Net Compact Framework XML序列化都不支持该功能。
用了我大约4天的时间,终于完成了.Net Compact Framework 二进制序列化的第一版V0.1,目前测试的结果还是令人满意的(以下结果是在windows平台下测试的,循环执行100次)。
1、.Net Micro Framework binary serialize
Data Length : 103 byte
Serialize Time : 46 ms
Deserialize Time : 46 ms
2、.Net Compact Framework xml serialize
Data Length : 998 byte
Serialize Time : 31545 ms
Deserialize Time : 34092 ms
3、CompactFormatterPlus binary serialize
Data Length : 1598 byte
Serialize Time : 103 ms
Deserialize Time : 132 ms
4、.Net Framework binary serialize
Data Length : 828 byte
Serialize Time : 18 ms
Deserialize Time : 17 ms
5、Yefan binary serialize
Data Length : 113 byte
Serialize Time : 8 ms
Deserialize Time : 8 ms
由以上可以看出,除了在体积上稍稍大于.Net Micro Framework的二进制序列化外,和其它序列化后的结果相比,几乎相差一个数量级,此外执行时间是最小的,并且其它相比,是几个数量级的差别。
在开发二进制序列化过程中发现,.Net Compact Framework xml和CompactFormatterPlus都不支持循环引用,如下面的类:
Class Test1
{
Public int v1=0;
Public Object o=null;
}
Test1 t=new Test1();
t.o=t; //为自身
如果对t序列化,则.Net Compact Framework xml和CompactFormatterPlus都会出现异常,此外对CompactFormatterPlus,如果enum类型的基础类型不是默认的int型,也会抛出异常,如下面的枚举:
Enum Test:byte {one ,two};
主要测试代码如下: