自行开发高效精简的二进制序列化库(支持精简框架集)

06年开发基于Window CE的嵌入式组态软件时就曾遇到序列化问题,由于程序运行在Window CE平台,其上的.Net Compact Framework仅支持XML序列化,而XML序列化不仅序列化后的体积较大,而且执行时间较长(参见我以前写的文章:嵌入式组态环境升级及XML反序列化慢的困惑如何加速XML反序列化(精简框架集2.0SP1,WinCE4.2))。

而当时支持.Net Compact Framework的二进制序列化就是CompactFormatter(参见黎波的文章: .NET Compact Framework 2.0 中使用序列化)了,由于是第三方所开发,功能上尚不完善,故没有选用。

前段时间看MSN Direct代码,发现使用.Net Micro Framework二进制序列化后的广播数据比较小,并且速度快。所以想办法把相关代码做了平台移植,可没有想到的是在.net micro Framework.Net Framework中都可以正常运行的代码,在.NET Compact Framework中竟然不能运行(主要是对Assembly操作的相关函数支持不够)。

由于目前在.Net Compact Framework开发的应用逐渐增多,并且最近也打算升级原先开发的嵌入式组态软件,经过再三考虑决定自行开发支持精简框架集的二进制序列化(说明:.Net Micro Framework平台上的二进制序列化,由于运行在ARM系列的CPU上,会考虑一些大小端的问题,所以多于一个byte的值变量都要进行特殊处理,速度相对较慢,不过.Net Micro Framework二进制序列化的优点是,支持bit序列化(bool变量按位存取,也可以为其它变量指定位数),所以它的序列化结果是最精简的)。

.Net Micro Framework二进制序列化代码做参考,所以自行开发一个支持精简框架集二进制序列化库,并不是一件特别繁杂和痛苦的事:-

在开发二进制序列化之前,对要完成的二进制序列化库,有以下几方面的考虑:

一、速度要快;

二、体积要小;

三、要支持自定义序列化;

针对第一点,故舍弃了.Net Micro Framework二进制序列化的bit序列化支持,并且精简了一些功能,比如仅支持原生数据类型的一维数组序列化,仅支持ArrayList,不支持泛型,此外不自行反射Assembly中的Type,和.Net Compact Framework XML序列化一样,需要开发者从外部传入Type列表;

针对第二点采用了很多.Net Micro Framework的二进制序列化思想,如序列化后的数据中不保存Type 的完整的名字,仅保存该名字的4个字节的哈希值,字符串的长度和数组长度用变长的1~4个字节的空间来保存,多个对象引用相同,仅保存首个对象等等;

而第三点主要和我开发的嵌入式组态功能相关,大量的图元派生于基类图元,而基类中的大量属性,在不同的图元中用到的都不同,如果一概而论全部序列化,则结果会比较大,而采用自定义序列化就能很好地解决这个问题。此外值得一提的是.Net Micro Framework二进制序列化和.Net Compact Framework XML序列化都不支持该功能。

用了我大约4天的时间,终于完成了.Net Compact Framework 二进制序列化的第一版V0.1,目前测试的结果还是令人满意的(以下结果是在windows平台下测试的,循环执行100次)。

1.Net Micro Framework binary serialize

Data Length : 103 byte

Serialize Time : 46 ms

Deserialize Time : 46 ms

2.Net Compact Framework xml serialize

Data Length : 998 byte

Serialize Time : 31545 ms

Deserialize Time : 34092 ms

3CompactFormatterPlus binary serialize

Data Length : 1598 byte

Serialize Time : 103 ms

Deserialize Time : 132 ms

4.Net Framework binary serialize

Data Length : 828 byte

Serialize Time : 18 ms

Deserialize Time : 17 ms

5Yefan binary serialize

Data Length : 113 byte

Serialize Time : 8 ms

Deserialize Time : 8 ms

由以上可以看出,除了在体积上稍稍大于.Net Micro Framework的二进制序列化外,和其它序列化后的结果相比,几乎相差一个数量级,此外执行时间是最小的,并且其它相比,是几个数量级的差别。

在开发二进制序列化过程中发现,.Net Compact Framework xmlCompactFormatterPlus都不支持循环引用,如下面的类:

Class Test1

{

Public int v1=0;

Public Object o=null;

}

Test1 t=new Test1();

t.o=t; //为自身

如果对t序列化,则.Net Compact Framework xmlCompactFormatterPlus都会出现异常,此外对CompactFormatterPlus,如果enum类型的基础类型不是默认的int型,也会抛出异常,如下面的枚举:

Enum Testbyte {one ,two};

主要测试代码如下:

下载地址:http://www.sky-walker.com.cn/yefan/YFSerializeTest.rar

你可能感兴趣的:(序列化)