目录
前言
语法
标识符
字段
字段类型
proto2和proto3区别
Protobuf即Protocol Buffers,是Google公司开发的一种跨语言和平台的序列化数据结构的方式,是一个灵活的、高效的用于序列化数据的协议。
与XML和JSON格式相比,protobuf更小、更快、更便捷。protobuf是跨语言的,并且自带一个编译器(protoc),只需要用protoc进行编译,就可以编译成Java、Python、C++、C#、Go等多种语言代码,然后可以直接使用,不需要再写其它代码,自带有解析的代码。
只需要将要被序列化的结构化数据定义一次(在.proto文件定义),便可以使用特别生成的源代码(使用protobuf提供的生成工具)轻松的使用不同的数据流完成对结构数据的读写操作。甚至可以更新.proto文件中对数据结构的定义而不会破坏依赖旧格式编译出来的程序。
Protobuf的优点如下:
Protobuf的缺点如下:
protobuf协议文件名后缀名为.proto。一个简单的protobuf协议如下:
1 syntax="proto3";
2
3 package protobuf.addressbook;
4
5 enum PhoneType
6 {
7 MOBILE = 0;
8 HOME = 1;
9 WORK = 2;
10 }
11
12 message Person
13 {
14 optional string name = 1;
15 optional uint32 age = 2;
16 optional string email = 3;
17
18 message PhoneNumber
19 {
20 optional string number = 1;
21 optional PhoneType type = 2;
22 }
23
24 repeated PhoneNumber phone = 4;
25
26 }
27
28
29 message AddressBook
30 {
31 repeated Person person = 1;
32 }
字段格式:
role type name = tag [default value]
role 有三种取值:
required:该字段必须给值,不能为空。否则message被认为是未初始化的。如果试图建立一个未初始化的message将会抛出RuntimeException异常,解析未初始化的message会抛出IOException异常。
optional:表示该字段是可选值,可以为空。如果不设置,会设置一个默认值。也可以自定义默认值。如果没有自定义默认值,会是用系统默认值。
repeated:表示该字段可以重复,可等同于动态数组。
注意:required字段是永久性的,如果之后不使用该字段,或者该字段标识改为optional或repeated,那么使用就接口读取新协议时,如果发现没有该字段,会认为该消息不完整,会拒收或者丢弃该消息。
N 表示打包的字节并不是固定。而是根据数据的大小或者长度。
例如int32,如果数值比较小,在0~127时,使用一个字节打包。
关于枚举的打包方式和uint32相同。
关于message,类似于C语言中的结构包含另外一个结构作为数据成员一样。
关于 fixed32 和int32的区别。fixed32的打包效率比int32的效率高,但是使用的空间一般比int32多。因此一个属于时间效率高,一个属于空间效率高。根据项目的实际情况,一般选择fixed32,如果遇到对传输数据量要求比较苛刻的环境,可以选择int32.
总的来说proto3比proto2支持跟多语言,但是更加简洁。去除了复杂的语法和特性。
syntax = "proto3";
实际在proto2中也不推荐使用required,因为该字段是永久性的。如果以后因为某种原因,想不用该字段,或者要将该字段改成optional或者repeated,那么使用旧接口读取新的协议时,如果发现没有该字段,他们会认为该字段是不完整的,会拒接接收该消息,或者直接丢弃。
在 proto2 中,需要明确使用 [packed=true] 来为字段指定比较紧凑的 packed 编码方式。
在 proto2 中,可以使用 default 选项为某一字段指定默认值。在 proto3 中,字段的默认值只能根据字段类型由系统决定。也就是说,默认值全部是约定好的,而不再提供指定默认值的语法。
在字段被设置为默认值的时候,该字段不会被序列化。这样可以节省空间,提高效率。
但这样就无法区分某字段是根本没赋值,还是赋值了默认值。这在 proto3 中问题不大,但在 proto2 中会有问题。
分组的功能完全可以用消息嵌套的方式来实现,并且更清晰。
proto3 中新增的 Any 类型有点像 C/C++ 中的 void*
如果要创建一个关联映射,Protobuf提供了一种快捷的语法:
key_type可以是任意Integer或者string类型(除了floating和bytes的任意标量类型都可以),value_type可以是任意类型,但不能是map类型。
map map_field = N;
注意:
map语法序列化后等同于如下内容,所以Map不经常使用。
message MapFieldEntry {
key_type key = 1;
value_type value = 2;
}
repeated MapFieldEntry map_field = N;
Oneof定义用来代表在实现的时候,该组属性中的字段有且只能有一个被定义,不能出现多个。
message SampleMessage {
oneof test_oneof {
string name = 4;
SubMessage sub_message = 9;
}
}
上述定义中只能出现name或者sub_message的出现,不能同时出现。
注意:
protobuf的编译和使用可以看:下一篇博客
参考文档:
ProtoBuf 语法简介_n大橘为重n的博客-CSDN博客_protobuf语法
Protobuf简介_Shower稻草人的博客-CSDN博客_protobuf介绍
【Protocol Buffer】Protocol Buffer入门教程(三):proto3与proto2的区别_沧海一笑的技术博客_51CTO博客
Protobuf简介_Shower稻草人的博客-CSDN博客_protobuf介绍