Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?

1  go grpc-go 相关技术专栏 总入口

2  Protobuf介绍与实战 图文专栏 文章目录

本次测试环境是64位Mac系统

1、数据类型为int32,int64,uint32,uint64,bool,enum时,Varint是如何编码的?

1.1、测试用例1:先看一下十进制1的二进制形式;以及在64位操作系统下,1占用多少字节?

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第1张图片

可以使用Varint编码进行改进。

1.2、测试用例2:使用Varint编码,传输十进制1的情况

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第2张图片

如果不考虑是32位操作系统,还是64位操作系统的话,用1个字节来表示数值,当传输的数值小于128且 大于0时,Varint的编码结果跟二进制原码是一样的

1.3、测试用例3:使用Varint编码,传输十进制128的情况?

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第3张图片

[00010000 10000000 00000001]

前面多余的0,可以不显示,为了分析,专门打印输出的。

好,先看第1个字节00010000
Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第4张图片

从第1个字节中,可以得到标识号,即得到变量类型,变量名称;以及变量值的编码方式

接下来,看第2,3个字节 10000000 00000001
Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第5张图片

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第6张图片

即,通过解析第2,3字节,获得传输的是128。

uint32, int64,uint64类型就不再举例了,原理一样的。

1.4、测试用例4:使用Varint编码bool 类型的变量值

bool类型的变量值,本质可看做为0,1

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第7张图片

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第8张图片

1.4.1、当 bool类型的变量值为 false 时,其编码结果为空,为什么?

这是 Varint编码 为了提高编码效率做的一个小技巧:

若数据类型的变量值刚好为该类型的初始化值的话,Varint编码就采用空进行传输;

当接收方对某字段进行解析时,发现为空,就会按照此字段的默认值进行初始化;

1.4.2、验证一下:int32类型的变量,变量值为0时Varint编码的情况:

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第9张图片

1.5、测试用例5:使用Varint编码,对enum 类型进行编码

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第10张图片

Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第11张图片

enum类型的变量值,本质上还是整型数。

具体编码过程,跟int32类型是一样的,就不再具体写了。

2、数据类型为sint32,sint64时,Varint是如何编码的?(ZigZag编码)

前文我们已经分析了,如果使用Varint编码直接对负数进行编码的话,会占用很多字节,违背我们的初衷;

既然,Varint编码对正数很有效果,那么,能不能先将负数转换为正数呢?

sint32, sint64类型就是针对的是负数情况;

sin32,sint64类型,使用的是zigzag编码,该编码是对Varint编码的改进;

2.1、zigzag编码

zigzag编码的本质,是将负数按照一定的规则变换为一个正数,然后,在使用Varint编码的。

ZigZag编码将有符号数映射到无符号数以便具有较小绝对值的数字(如-1)也具有较小的varint编码值。

这样做的方式是通过正整数和负整数来回“曲折”,将-1编码为1,将1编码为2,将-2编码为3…………以此类推。

如下表所示:

Signed Original Encoded As
0 0
-1 1
1 2
-2 3
2 4
-3 5
2147483647 4294967294
-2147483648 4294967295

sint32类型的0,经过sint32编码后,为0

sint32类型的-1,经过sint32编码后,为1

sint32类型的1,经过sint32编码后,为2

sint32类型的-2,经过sint32编码后,为3

sint32类型的2,经过sint32编码后,为4


其实,

对于负奇数来说,公式:|-3|*2-1=5

对于正数来说,公式:数值*2

或者:可以从移位的角度看

如,int类型zigzag变换的代码表示为(n << 1) ^ (n >> 31)

有关介绍网址:
https://www.it610.com/article/1187247270198878208.htm
http://wikimore.github.io/2016/09/22/zig-zag-intro/
http://wikimore.github.io/2016/09/22/zig-zag-intro/
https://blog.csdn.net/mijichui2153/article/details/111475823

举例说明:
sint32类型的-300,
Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第12张图片

-300, 如果用int32类型表示的话,其实,|-300|*2-1=599

即,直接使用Varint对599进行编码:
Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?_第13张图片

如果某个类型的变量值一直是负数的话,可以使用sint32, sint64进行声明,从而提高了编码效率

或者说,某个类型的变量值大部分情况下是负数,也可以。

下一篇文章

  在proto文件中,数据类型为string,bytes,embedded messages,packed repeated fields时,变量值采用何种方式编码(Length-delimited)

你可能感兴趣的:(grpc-go,protobuf,golang,docker,kubernetes)