服务器开发的数据表示/编码的方法

服务器开发中程序数据的两种表示形态:

  1. 保存在内存中的数据。
  2. 需要在网络/磁盘上面传输或存储的数据,这个时候编码需要成为某一种字节序列。

两种类型之间的转换,叫做序列化和反序列化。总结一下我理解的几种序列化/反序列话的方法的优缺点。

1. 使用语言层面的序列化包/库

比如说python有pickle这样的包,可以把rt的数据转换成一种字节编码进行序列化。

优缺点:

  1. 仅限于某一种语言,没有办法跨语言。
  2. 编码的效率似乎不高
  3. 服务器开发中 数据的格式 往往在不停的变化,需要向前兼容和向后兼容。比如一个结构体里面的元素,可能在不停的添加。这样需要序列化的时候,可以多个版本的数据之间兼容。
  4. 看到有人说,这种方式不安全。(我没有体会到)
2. json/xml 序列化工具

这种工具应该是第一种方式的改良,比如说,我可以python --> 序列化为json --> 反序列化 --> go 。这样可以使用跨语言的数据表示。这应该是我理解到的优点。

缺点:

  1. 依然是编码效率低 (相比较二进制的编码而言,类似于人可以看懂的编码的效率是低的)
  2. 依然是没有向前向后兼容
3. 二进制json的工具

这个类型的方式是上一种方式的改进,二进制的编码效率更高。但是,这个二进制的编码的内容和后面提及的protobuff的二进制编码是不一样的。二进制的json可以理解为对json内容用二进制的方式表示,二进制的数据里面是包含json的key和value的。但是,protobuff的二进制是不保存key的,只保存value,这样效率更高。

缺点:

  1. 依然没有办法多版本的数据兼容
  2. 编码效率还可以提高
4. protobuff

protobuff是前面几种方式的改进。

  1. 通过版本号的机制,解决了数据的多版本之间的兼容。
  2. protobuff采用二进制编码,效率比较高。这个和二进制json不同的是,它的二进制数据中是不包含key的,只有value。
  3. protobuff类似可变长编码的机制进行压缩数据,这样的编码效率会进一步的提高。
  4. 可以自动生成多种语言的数据描述文件,实现跨语言。

protobuff

todo
(这个坑先挖在这里,这样以后会有填它的动力)

你可能感兴趣的:(服务器开发的数据表示/编码的方法)