Sherlock_Homles

Protobuf | Google Protocol Buffer 的使用和原理

Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准，目前已经正在使用的有超过 48,162 种报文格式定义和超过 12,183 个 .proto 文件。他们用于 RPC 系统和持续数据存储系统。

Protocol Buffers 是一种轻便高效的结构化数据存储格式，可以用于结构化数据串行化，或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。

一、为什么使用Protocol Buffer？

比如：我们的客户端程序是使用Java开发的，可能运行自不同的平台，如：Linux、Windows或者是Android，而我们的服务器程序通常是基于Linux平台并使用C++开发完成的。在这两种程序之间进行数据通讯时存在多种方式用于设计消息格式，如：
1. 直接传递C/C++语言中一字节对齐的结构体数据，只要结构体的声明为定长格式，那么该方式对于C/C++程序而言就非常方便了，仅需将接收到的数据按照结构体类型强行转换即可。事实上对于变长结构体也不会非常麻烦。在发送数据时，也只需定义一个结构体变量并设置各个成员变量的值之后，再以char*的方式将该二进制数据发送到远端。反之，该方式对于Java开发者而言就会非常繁琐，首先需要将接收到的数据存于ByteBuffer之中，再根据约定的字节序逐个读取每个字段，并将读取后的值再赋值给另外一个值对象中的域变量，以便于程序中其他代码逻辑的编写。对于该类型程序而言，联调的基准是必须客户端和服务器双方均完成了消息报文构建程序的编写后才能展开，而该设计方式将会直接导致Java程序开发的进度过慢。即便是Debug阶段，也会经常遇到Java程序中出现各种域字段拼接的小错误。

2. 使用SOAP协议(WebService)作为消息报文的格式载体，由该方式生成的报文是基于文本格式的，同时还存在大量的XML描述信息，因此将会大大增加网络IO的负担。又由于XML解析的复杂性，这也会大幅降低报文解析的性能。总之，使用该设计方式将会使系统的整体运行性能明显下降。

对于以上两种方式所产生的问题，Protocol Buffer均可以很好的解决，不仅如此，Protocol Buffer还有一个非常重要的优点就是可以保证同一消息报文新旧版本之间的兼容性。

二、定义第一个Protocol Buffer消息

创建扩展名为.proto的文件，如：MyMessage.proto，并将以下内容存入该文件中。

message LogonReqMessage {
          required int64 acctID = 1;
          required string passwd = 2;
      }

这里将给出以上消息定义的关键性说明。

1. message是消息定义的关键字，等同于C++中的struct/class，或是Java中的class。
      2. LogonReqMessage为消息的名字，等同于结构体名或类名。
      3. required前缀表示该字段为必要字段，既在序列化和反序列化之前该字段必须已经被赋值。与此同时，在Protocol Buffer中还存在另外两个类似的关键字，optional和repeated，带有这两种限定符的消息字段则没有required字段这样的限制。相比于optional，repeated主要用于表示数组字段。
      4. int64和string分别表示长整型和字符串型的消息字段，在Protocol Buffer中存在一张类型对照表，既Protocol Buffer中的数据类型与其他编程语言(C++/Java)中所用类型的对照。该对照表中还将给出在不同的数据场景下，哪种类型更为高效。该对照表将在后面给出。
      5. acctID和passwd分别表示消息字段名，等同于Java中的域变量名，或是C++中的成员变量名。
      6. 标签数字1和2则表示不同的字段在序列化后的二进制数据中的布局位置。在该例中，passwd字段编码后的数据一定位于acctID之后。需要注意的是该值在同一message中不能重复。另外，对于Protocol Buffer而言，标签值为1到15的字段在编码时可以得到优化，既标签值和类型信息仅占有一个byte，标签范围是16到2047的将占有两个bytes，而Protocol Buffer可以支持的字段数量则为2的29次方减一。有鉴于此，我们在设计消息结构时，可以尽可能考虑让repeated类型的字段标签位于1到15之间，这样便可以有效的节省编码后的字节数量。

三、定义第二个（含有枚举字段）Protocol Buffer消息

 //在定义Protocol Buffer的消息时，可以使用和C++/Java代码同样的方式添加注释。
      enum UserStatus {
          OFFLINE = 0; //表示处于离线状态的用户
          ONLINE = 1;  //表示处于在线状态的用户
      }
      message UserInfo {
          required int64 acctID = 1;
          required string name = 2;
          required UserStatus status = 3;
      }

这里将给出以上消息定义的关键性说明（仅包括上一小节中没有描述的。

1. enum是枚举类型定义的关键字，等同于C++/Java中的enum。
      2. UserStatus为枚举的名字。
      3. 和C++/Java中的枚举不同的是，枚举值之间的分隔符是分号，而不是逗号。
      4. OFFLINE/ONLINE为枚举值。
      5. 0和1表示枚举值所对应的实际整型值，和C/C++一样，可以为枚举值指定任意整型值，而无需总是从0开始定义。如：

 enum OperationCode {
          LOGON_REQ_CODE = 101;
          LOGOUT_REQ_CODE = 102;
          RETRIEVE_BUDDIES_REQ_CODE = 103;
    
          LOGON_RESP_CODE = 1001;
          LOGOUT_RESP_CODE = 1002;
          RETRIEVE_BUDDIES_RESP_CODE = 1003;
      }

四、定义第三个（含有嵌套消息字段）Protocol Buffer消息

我们可以在同一个.proto文件中定义多个message，这样便可以很容易的实现嵌套消息的定义。如：

enum UserStatus {
          OFFLINE = 0;
          ONLINE = 1;
      }
      message UserInfo {
          required int64 acctID = 1;
          required string name = 2;
          required UserStatus status = 3;
      }
      message LogonRespMessage {
          required LoginResult logonResult = 1;
          required UserInfo userInfo = 2;
      }

这里将给出以上消息定义的关键性说明（仅包括上两小节中没有描述的）。
      1. LogonRespMessage消息的定义中包含另外一个消息类型作为其字段，如UserInfo userInfo。
      2. 上例中的UserInfo和LogonRespMessage被定义在同一个.proto文件中，那么我们是否可以包含在其他.proto文件中定义的message呢？Protocol Buffer提供了另外一个关键字import，这样我们便可以将很多通用的message定义在同一个.proto文件中，而其他消息定义文件可以通过import的方式将该文件中定义的消息包含进来，如：
      import "myproject/CommonMessages.proto"

五、限定符(required/optional/repeated)的基本规则

1. 在每个消息中必须至少留有一个required类型的字段。
      2. 每个消息中可以包含0个或多个optional类型的字段。
      3. repeated表示的字段可以包含0个或多个数据。需要说明的是，这一点有别于C++/Java中的数组，因为后两者中的数组必须包含至少一个元素。
      4. 如果打算在原有消息协议中添加新的字段，同时还要保证老版本的程序能够正常读取或写入，那么对于新添加的字段必须是optional或repeated。道理非常简单，老版本程序无法读取或写入新增的required限定符的字段。

六、类型对照表

一个标量消息字段可以含有一个如下的类型——该表格展示了定义于.proto文件中的类型，以及与之对应的、在自动生成的访问类中定义的类型：

.proto类型	Java 类型	C++类型	备注
double	double	double
float	float	float
int32	int	int32	使用可变长编码方式。编码负数时不够高效——如果你的字段可能含有负数，那么请使用sint32。
int64	long	int64	使用可变长编码方式。编码负数时不够高效——如果你的字段可能含有负数，那么请使用sint64。
uint32	int[1]	uint32	Uses variable-length encoding.
uint64	long[1]	uint64	Uses variable-length encoding.
sint32	int	int32	使用可变长编码方式。有符号的整型值。编码时比通常的int32高效。
sint64	long	int64	使用可变长编码方式。有符号的整型值。编码时比通常的int64高效。
fixed32	int[1]	uint32	总是4个字节。如果数值总是比总是比228大的话，这个类型会比uint32高效。
fixed64	long[1]	uint64	总是8个字节。如果数值总是比总是比256大的话，这个类型会比uint64高效。
sfixed32	int	int32	总是4个字节。
sfixed64	long	int64	总是8个字节。
bool	boolean	bool
string	String	string	一个字符串必须是UTF-8编码或者7-bit ASCII编码的文本。
bytes	ByteString	string	可能包含任意顺序的字节数据。

七、Protocol Buffer消息升级原则

在实际的开发中会存在这样一种应用场景，既消息格式因为某些需求的变化而不得不进行必要的升级，但是有些使用原有消息格式的应用程序暂时又不能被立刻升级，这便要求我们在升级消息格式时要遵守一定的规则，从而可以保证基于新老消息格式的新老程序同时运行。规则如下：
      1. 不要修改已经存在字段的标签号。
      2. 任何新添加的字段必须是optional和repeated限定符，否则无法保证新老程序在互相传递消息时的消息兼容性。
      3. 在原有的消息中，不能移除已经存在的required字段，optional和repeated类型的字段可以被移除，但是他们之前使用的标签号必须被保留，不能被新的字段重用。
      4. int32、uint32、int64、uint64和bool等类型之间是兼容的，sint32和sint64是兼容的，string和bytes是兼容的，fixed32和sfixed32，以及fixed64和sfixed64之间是兼容的，这意味着如果想修改原有字段的类型时，为了保证兼容性，只能将其修改为与其原有类型兼容的类型，否则就将打破新老消息格式的兼容性。
      5. optional和repeated限定符也是相互兼容的。

八、Packages

我们可以在.proto文件中定义包名，如：
package ourproject.lyphone;
该包名在生成对应的C++文件时，将被替换为名字空间名称，既namespace ourproject { namespace lyphone。而在生成的Java代码文件中将成为包名。

九、Options

Protocol Buffer允许我们在.proto文件中定义一些常用的选项，这样可以指示Protocol Buffer编译器帮助我们生成更为匹配的目标语言代码。Protocol Buffer内置的选项被分为以下三个级别：
      1. 文件级别，这样的选项将影响当前文件中定义的所有消息和枚举。
      2. 消息级别，这样的选项仅影响某个消息及其包含的所有字段。
      3. 字段级别，这样的选项仅仅响应与其相关的字段。
      下面将给出一些常用的Protocol Buffer选项。
      1. option java_package = "com.companyname.projectname";
      java_package是文件级别的选项，通过指定该选项可以让生成Java代码的包名为该选项值，如上例中的Java代码包名为com.companyname.projectname。与此同时，生成的Java文件也将会自动存放到指定输出目录下的com/companyname/projectname子目录中。如果没有指定该选项，Java的包名则为package关键字指定的名称。该选项对于生成C++代码毫无影响。
      2. option java_outer_classname = "LYPhoneMessage";
      java_outer_classname是文件级别的选项，主要功能是显示的指定生成Java代码的外部类名称。如果没有指定该选项，Java代码的外部类名称为当前文件的文件名部分，同时还要将文件名转换为驼峰格式，如：my_project.proto，那么该文件的默认外部类名称将为MyProject。该选项对于生成C++代码毫无影响。
      注：主要是因为Java中要求同一个.java文件中只能包含一个Java外部类或外部接口，而C++则不存在此限制。因此在.proto文件中定义的消息均为指定外部类的内部类，这样才能将这些消息生成到同一个Java文件中。在实际的使用中，为了避免总是输入该外部类限定符，可以将该外部类静态引入到当前Java文件中，如：import static com.company.project.LYPhoneMessage.*。
      3. option optimize_for = LITE_RUNTIME;
      optimize_for是文件级别的选项，Protocol Buffer定义三种优化级别SPEED/CODE_SIZE/LITE_RUNTIME。缺省情况下是SPEED。
      SPEED: 表示生成的代码运行效率高，但是由此生成的代码编译后会占用更多的空间。
      CODE_SIZE: 和SPEED恰恰相反，代码运行效率较低，但是由此生成的代码编译后会占用更少的空间，通常用于资源有限的平台，如Mobile。
      LITE_RUNTIME: 生成的代码执行效率高，同时生成代码编译后的所占用的空间也是非常少。这是以牺牲Protocol Buffer提供的反射功能为代价的。因此我们在C++中链接Protocol Buffer库时仅需链接libprotobuf-lite，而非libprotobuf。在Java中仅需包含protobuf-java-2.4.1-lite.jar，而非protobuf-java-2.4.1.jar。
      注：对于LITE_MESSAGE选项而言，其生成的代码均将继承自MessageLite，而非Message。
      4. [pack = true]: 因为历史原因，对于数值型的repeated字段，如int32、int64等，在编码时并没有得到很好的优化，然而在新近版本的Protocol Buffer中，可通过添加[pack=true]的字段选项，以通知Protocol Buffer在为该类型的消息对象编码时更加高效。如：
      repeated int32 samples = 4 [packed=true]。
      注：该选项仅适用于2.3.0以上的Protocol Buffer。
      5. [default = default_value]: optional类型的字段，如果在序列化时没有被设置，或者是老版本的消息中根本不存在该字段，那么在反序列化该类型的消息是，optional的字段将被赋予类型相关的缺省值，如bool被设置为false，int32被设置为0。Protocol Buffer也支持自定义的缺省值，如：
      optional int32 result_per_page = 3 [default = 10]。

十、命令行编译工具

  protoc--proto_path=IMPORT_PATH --cpp_out=DST_DIR --java_out=DST_DIR --python_out=DST_DIR path/to/file.proto
      这里将给出上述命令的参数解释。
      1. protoc为Protocol Buffer提供的命令行编译工具。
      2. --proto_path等同于-I选项，主要用于指定待编译的.proto消息定义文件所在的目录，该选项可以被同时指定多个。
      3. --cpp_out选项表示生成C++代码，--java_out表示生成Java代码，--python_out则表示生成Python代码，其后的目录为生成后的代码所存放的目录。
      4. path/to/file.proto表示待编译的消息定义文件。
      注：对于C++而言，通过Protocol Buffer编译工具，可以将每个.proto文件生成出一对.h和.cc的C++代码文件。生成后的文件可以直接加载到应用程序所在的工程项目中。如：MyMessage.proto生成的文件为MyMessage.pb.h和MyMessage.pb.cc。

十一、message生成的C++代码示例

1.简单message生成的C++代码

这里先定义一个最简单的message，其中只是包含原始类型的字段。

 option optimize_for = LITE_RUNTIME;
      message LogonReqMessage {
          required int64 acctID = 1;
          required string passwd = 2;
      }

由于我们在MyMessage文件中定义选项optimize_for的值为LITE_RUNTIME，因此由该.proto文件生成的所有C++类的父类均为::google::protobuf::MessageLite，而非::google::protobuf::Message。MessageLite类是Message的父类，在MessageLite中将缺少Protocol Buffer对反射的支持，而此类功能均在Message类中提供了具体的实现。对于我们的项目而言，整个系统相对比较封闭，不会和更多的外部程序进行交互，与此同时，我们的客户端部分又是运行在Android平台，有鉴于此，我们考虑使用LITE版本的Protocol Buffer。这样不仅可以得到更高编码效率，而且生成代码编译后所占用的资源也会更少，至于反射所能带来的灵活性和极易扩展性，对于该项目而言完全可以忽略。下面我们来看一下由message LogonReqMessage生成的C++类的部分声明，以及常用方法的说明性注释。

 class LogonReqMessage : public ::google::protobuf::MessageLite {
     public:
          LogonReqMessage();
          virtual ~LogonReqMessage();
  
          // implements Message ----------------------------------------------
          //下面的成员函数均实现自MessageLite中的虚函数。
          //创建一个新的LogonReqMessage对象，等同于clone。
          LogonReqMessage* New() const;
         //用另外一个LogonReqMessage对象初始化当前对象，等同于赋值操作符重载（operator=）
         void CopyFrom(const LogonReqMessage& from);
         //清空当前对象中的所有数据，既将所有成员变量置为未初始化状态。
         void Clear();
         //判断当前状态是否已经初始化。
         bool IsInitialized() const;
         //在给当前对象的所有变量赋值之后，获取该对象序列化后所需要的字节数。
         int ByteSize() const;
         //获取当前对象的类型名称。
         ::std::string GetTypeName() const;
 
         // required int64 acctID = 1;
         //下面的成员函数都是因message中定义的acctID字段而生成。
         //这个静态成员表示AcctID的标签值。命名规则是k + FieldName(驼峰规则) + FieldNumber。
         static const int kAcctIDFieldNumber = 1;
         //如果acctID字段已经被设置返回true，否则false。
         inline bool has_acctid() const;
         //执行该函数后has_acctid函数将返回false，而下面的acctid函数则返回acctID的缺省值。
         inline void clear_acctid();
         //返回acctid字段的当前值，如果没有设置则返回int64类型的缺省值。
         inline ::google::protobuf::int64 acctid() const;
         //为acctid字段设置新值，调用该函数后has_acctid函数将返回true。
         inline void set_acctid(::google::protobuf::int64 value);
     
         // required string passwd = 2;
         //下面的成员函数都是因message中定义的passwd字段而生成。这里生成的函数和上面acctid
         //生成的那组函数基本相似。因此这里只是列出差异部分。
         static const int kPasswdFieldNumber = 2;
         inline bool has_passwd() const;
         inline void clear_passwd();
         inline const ::std::string& passwd() const;
         inline void set_passwd(const ::std::string& value);
         //对于字符串类型字段设置const char*类型的变量值。
         inline void set_passwd(const char* value);
         inline void set_passwd(const char* value, size_t size);
         //可以通过返回值直接给passwd对象赋值。在调用该函数之后has_passwd将返回true。
         inline ::std::string* mutable_passwd();
         //释放当前对象对passwd字段的所有权，同时返回passwd字段对象指针。调用此函数之后，passwd字段对象
         //的所有权将移交给调用者。此后再调用has_passwd函数时将返回false。
         inline ::std::string* release_passwd();
     private:
         ... ... 
     };

下面是读写LogonReqMessage对象的C++测试代码和说明性注释。

 1     void testSimpleMessage()
 2     {
 3         printf("==================This is simple message.================\n");
 4         //序列化LogonReqMessage对象到指定的内存区域。
 5         LogonReqMessage logonReq;
 6         logonReq.set_acctid(20);
 7         logonReq.set_passwd("Hello World");
 8         //提前获取对象序列化所占用的空间并进行一次性分配，从而避免多次分配
 9         //而造成的性能开销。通过该种方式，还可以将序列化后的数据进行加密。
10         //之后再进行持久化，或是发送到远端。
11         int length = logonReq.ByteSize();
12         char* buf = new char[length];
13         logonReq.SerializeToArray(buf,length);
14         //从内存中读取并反序列化LogonReqMessage对象，同时将结果打印出来。
15         LogonReqMessage logonReq2;
16         logonReq2.ParseFromArray(buf,length);
17         printf("acctID = %I64d, password = %s\n",logonReq2.acctid(),logonReq2.passwd().c_str());
18         delete [] buf;
19     }

2、嵌套message生成的C++代码

enum UserStatus {
          OFFLINE = 0;
          ONLINE = 1;
      }
      enum LoginResult {
          LOGON_RESULT_SUCCESS = 0;
          LOGON_RESULT_NOTEXIST = 1;
          LOGON_RESULT_ERROR_PASSWD = 2;
          LOGON_RESULT_ALREADY_LOGON = 3;
          LOGON_RESULT_SERVER_ERROR = 4;
      }
      message UserInfo {
          required int64 acctID = 1;
          required string name = 2;
          required UserStatus status = 3;
      }
      message LogonRespMessage {
          required LoginResult logonResult = 1;
          required UserInfo userInfo = 2; //这里嵌套了UserInfo消息。
      }

对于上述消息生成的C++代码，UserInfo因为只是包含了原始类型字段，因此和上例中的LogonReqMessage没有太多的差别，这里也就不在重复列出了。由于LogonRespMessage消息中嵌套了UserInfo类型的字段，在这里我们将仅仅给出该消息生成的C++代码和关键性注释。

1     class LogonRespMessage : public ::google::protobuf::MessageLite {
 2     public:
 3         LogonRespMessage();
 4         virtual ~LogonRespMessage();
 5     
 6         // implements Message ----------------------------------------------
 7         ... ... //这部分函数和之前的例子一样。
 8         
 9         // required .LoginResult logonResult = 1;
10         //下面的成员函数都是因message中定义的logonResult字段而生成。
11         //这一点和前面的例子基本相同，只是类型换做了枚举类型LoginResult。    
12         static const int kLogonResultFieldNumber = 1;
13         inline bool has_logonresult() const;
14         inline void clear_logonresult();
15         inline LoginResult logonresult() const;
16         inline void set_logonresult(LoginResult value);
17         
18         // required .UserInfo userInfo = 2;
19         //下面的成员函数都是因message中定义的UserInfo字段而生成。
20         //这里只是列出和非消息类型字段差异的部分。
21         static const int kUserInfoFieldNumber = 2;
22         inline bool has_userinfo() const;
23         inline void clear_userinfo();
24         inline const ::UserInfo& userinfo() const;
25         //可以看到该类并没有生成用于设置和修改userInfo字段set_userinfo函数，而是将该工作
26         //交给了下面的mutable_userinfo函数。因此每当调用函数之后，Protocol Buffer都会认为
27         //该字段的值已经被设置了，同时has_userinfo函数亦将返回true。在实际编码中，我们可以
28         //通过该函数返回userInfo字段的内部指针，并基于该指针完成userInfo成员变量的初始化工作。
29         inline ::UserInfo* mutable_userinfo();
30         inline ::UserInfo* release_userinfo();
31     private:
32         ... ...
33     };

下面是读写LogonRespMessage对象的C++测试代码和说明性注释。

 1     void testNestedMessage()
 2     {
 3         printf("==================This is nested message.================\n");
 4         LogonRespMessage logonResp;
 5         logonResp.set_logonresult(LOGON_RESULT_SUCCESS);
 6         //如上所述，通过mutable_userinfo函数返回userInfo字段的指针，之后再初始化该对象指针。
 7         UserInfo* userInfo = logonResp.mutable_userinfo();
 8         userInfo->set_acctid(200);
 9         userInfo->set_name("Tester");
10         userInfo->set_status(OFFLINE);
11         int length = logonResp.ByteSize();
12         char* buf = new char[length];
13         logonResp.SerializeToArray(buf,length);
14     
15         LogonRespMessage logonResp2;
16         logonResp2.ParseFromArray(buf,length);
17         printf("LogonResult = %d, UserInfo->acctID = %I64d, UserInfo->name = %s, UserInfo->status = %d\n"
18             ,logonResp2.logonresult(),logonResp2.userinfo().acctid(),logonResp2.userinfo().name().c_str(),logonResp2.userinfo().status());
19         delete [] buf;
20     }

3、repeated嵌套message生成的C++代码

message BuddyInfo {
          required UserInfo userInfo = 1;
          required int32 groupID = 2;
      }
      message RetrieveBuddiesResp {
          required int32 buddiesCnt = 1;
          repeated BuddyInfo buddiesInfo = 2;
      }

对于上述消息生成的代码，我们将只是针对RetrieveBuddiesResp消息所对应的C++代码进行详细说明，其余部分和前面小节的例子基本相同，可直接参照。而对于RetrieveBuddiesResp类中的代码，我们也仅仅是对buddiesInfo字段生成的代码进行更为详细的解释。

1     class RetrieveBuddiesResp : public ::google::protobuf::MessageLite {
 2     public:
 3         RetrieveBuddiesResp();
 4         virtual ~RetrieveBuddiesResp();
 5 
 6         ... ... //其余代码的功能性注释均可参照前面的例子。
 7             
 8         // repeated .BuddyInfo buddiesInfo = 2;
 9         static const int kBuddiesInfoFieldNumber = 2;
10         //返回数组中成员的数量。
11         inline int buddiesinfo_size() const;
12         //清空数组中的所有已初始化成员，调用该函数后，buddiesinfo_size函数将返回0。
13         inline void clear_buddiesinfo();
14         //返回数组中指定下标所包含元素的引用。
15         inline const ::BuddyInfo& buddiesinfo(int index) const;
16         //返回数组中指定下标所包含元素的指针，通过该方式可直接修改元素的值信息。
17         inline ::BuddyInfo* mutable_buddiesinfo(int index);
18         //像数组中添加一个新元素。返回值即为新增的元素，可直接对其进行初始化。
19         inline ::BuddyInfo* add_buddiesinfo();
20         //获取buddiesInfo字段所表示的容器，该函数返回的容器仅用于遍历并读取，不能直接修改。
21         inline const ::google::protobuf::RepeatedPtrField< ::BuddyInfo >&
22           buddiesinfo() const;
23         //获取buddiesInfo字段所表示的容器指针，该函数返回的容器指针可用于遍历和直接修改。
24         inline ::google::protobuf::RepeatedPtrField< ::BuddyInfo >*
25           mutable_buddiesinfo();
26     private:
27         ... ...
28     };

下面是读写RetrieveBuddiesResp对象的C++测试代码和说明性注释。

1     void testRepeatedMessage()
 2     {
 3         printf("==================This is repeated message.================\n");
 4         RetrieveBuddiesResp retrieveResp;
 5         retrieveResp.set_buddiescnt(2);
 6         BuddyInfo* buddyInfo = retrieveResp.add_buddiesinfo();
 7         buddyInfo->set_groupid(20);
 8         UserInfo* userInfo = buddyInfo->mutable_userinfo();
 9         userInfo->set_acctid(200);
10         userInfo->set_name("user1");
11         userInfo->set_status(OFFLINE);
12     
13         buddyInfo = retrieveResp.add_buddiesinfo();
14         buddyInfo->set_groupid(21);
15         userInfo = buddyInfo->mutable_userinfo();
16         userInfo->set_acctid(201);
17         userInfo->set_name("user2");
18         userInfo->set_status(ONLINE);
19     
20         int length = retrieveResp.ByteSize();
21         char* buf = new char[length];
22         retrieveResp.SerializeToArray(buf,length);
23     
24         RetrieveBuddiesResp retrieveResp2;
25         retrieveResp2.ParseFromArray(buf,length);
26         printf("BuddiesCount = %d\n",retrieveResp2.buddiescnt());
27         printf("Repeated Size = %d\n",retrieveResp2.buddiesinfo_size());
28         //这里仅提供了通过容器迭代器的方式遍历数组元素的测试代码。
29         //事实上，通过buddiesinfo_size和buddiesinfo函数亦可循环遍历。
30         RepeatedPtrField* buddiesInfo = retrieveResp2.mutable_buddiesinfo();
31         RepeatedPtrField::iterator it = buddiesInfo->begin();
32         for (; it != buddiesInfo->end(); ++it) {
33             printf("BuddyInfo->groupID = %d\n", it->groupid());
34             printf("UserInfo->acctID = %I64d, UserInfo->name = %s, UserInfo->status = %d\n"
35                 , it->userinfo().acctid(), it->userinfo().name().c_str(),it->userinfo().status());
36         }
37         delete [] buf;
38     }

Protocol Buffer仍然提供了很多其它非常有用的功能，特别是针对序列化的目的地，比如文件流和网络流等。与此同时，也提供了完整的官方文档和规范的命名规则，在很多情况下，可以直接通过函数的名字便可获悉函数所完成的工作。

十二、简单消息编码布局

让我们先看一下下面的消息定义示例：

message Test1 {
          required int32 a = 1;
      }

假设我们在应用程序中将字段a的值设置为150（十进制），此后再将该对象序列化到Binary文件中，你可以看到文件的数据为：
08 96 01
这3个字节的含义又是什么呢？它们又是按照什么样的编码规则生成的呢？

1.Google Protocol Buffer 的 Encoding

Protobuf 序列化后所生成的二进制消息非常紧凑，这得益于 Protobuf 采用的非常巧妙的 Encoding 方法。

考察消息结构之前，让我首先要介绍一个叫做 Varint 的术语。Varint 是一种紧凑的表示数字的方法。它用一个或多个字节来表示一个数字，值越小的数字使用越少的字节数。这能减少用来表示数字的字节数。

比如对于 int32 类型的数字，一般需要 4 个 byte 来表示。但是采用 Varint，对于很小的 int32 类型的数字，则可以用 1 个 byte 来表示。当然凡事都有好的也有不好的一面，采用 Varint 表示法，大的数字则需要 5 个 byte 来表示。从统计的角度来说，一般不会所有的消息中的数字都是大数，因此大多数情况下，采用 Varint 后，可以用更少的字节数来表示数字信息。下面就详细介绍一下 Varint。

Varint 中的每个 byte 的最高位 bit 有特殊的含义，如果该位为 1，表示后续的 byte 也是该数字的一部分，如果该位为 0，则结束。其他的 7 个 bit 都用来表示数字。因此小于 128 的数字都可以用一个 byte 表示。大于 128 的数字，比如 300，会用两个字节来表示：1010 1100 0000 0010

下图演示了 Google Protocol Buffer 如何解析两个 bytes。注意到最终计算前将两个 byte 的位置相互交换过一次，这是因为 Google Protocol Buffer 字节序采用 little-endian 的方式。

图 1. Varint 编码

消息经过序列化后会成为一个二进制数据流，该流中的数据为一系列的 Key-Value 对。如下图所示：

图 2. Message Buffer

采用这种 Key-Pair 结构无需使用分隔符来分割不同的 Field。对于可选的 Field，如果消息中不存在该 field，那么在最终的 Message Buffer 中就没有该 field，这些特性都有助于节约消息本身的大小。

2、消息结构：

Protocol Buffer中的消息都是由一系列的键值对构成的。每个消息的二进制版本都是使用标签号作为Key，而每一个字段的名字和类型均是在解码的过程中根据目标类型（反序列化后的对象类型）进行配对的。在进行消息编码时，Key-Value被连接成字节流。在解码时，解析器可以直接跳过不识别的字段，这样就可以保证新老版本消息定义在新老程序之间的兼容性，从而有效的避免了使用older消息格式的older程序在解析newer程序发来的newer消息时，一旦遇到未知（新添加的）字段时而引发的解析和对象初始化的错误。最后，我们介绍一下字段标号和字段类型是如何进行编码的。下面先列出Protocol Buffer可以支持的字段类型。

Type	Meaning	Used For
0	Varint	int32, int64, uint32, uint64, sint32, sint64, bool, enum
1	64-bit	fixed64, sfixed64, double
2	Length-delimited	string, bytes, embedded messages, packed repeated fields
3	Start group	groups (deprecated)
4	End group	groups (deprecated)
5	32-bit	fixed32, sfixed32, float

      由于在编码后每一个字段的Key都是varint类型，Key的值是由字段标号和字段类型合成编码所得，其公式如下：
      field_number << 3 | field_type
      由此看出，Key的最后3个bits用于存储字段的类型信息。那么在使用该编码时，Protocol Buffer所支持的字段类型将不会超过8种。这里我们可以进一步计算出Protocol Buffer在一个消息中可以支持的字段数量为2的29次方减一。现在我们再来回顾一下之前给出的Test1消息被序列化后的第一个字节08的由来。
      0000 1000
      -> 000 1000                  //drop掉msb（最高位）
      最低的3位表示字段类型，即0为varint。我们再将结果右移3位，此时得到的结果为1，即字段a在消息Test1中的标签号。通过这样的结果，Protocol Buffer的解码器可以获悉当前字段的标签号是1，其后所跟随数据的类型为varint。现在我们可以继续利用上面讲到的知识分析出后两个字节(96 01)的由来。
      96 01 = 1001 0110 0000 0001
          -> 001 0110 000 0001   //drop两个字节的msb
          -> 000 0001 001 0110 //翻转高低字节
          -> 10010110    //去掉最高位中没用的0
          -> 128 + 16 + 4 + 2 = 150

3、更多的值类型：
（1）有符号整型
如前所述，类型0表示varint，其中包含int32/int64/uint32/uint64/sint32/sint64/bool/enum。在实际使用中，如果当前字段可以表示为负数，那么对于int32/int64和sint32/sint64而言，它们在进行编码时将存在着较大的差别。如果使用int32/int64表示一个负数，该字段的值无论是-1还是-2147483648，其编码后长度将始终为10个字节，就如同对待一个很大的无符号整型一样。反之，如果使用的是sint32/sint64，Protocol Buffer将会采用ZigZag编码方式，其编码后的结果将会更加高效。
这里简单讲述一下ZigZag编码，该编码会将有符号整型映射为无符号整型，以便绝对值较小的负数仍然可以有较小的varint编码值，如-1。下面是ZigZag对照表：

Signed Original	Encoded As
0	0
-1	1
1	2
-2	3
2147483647	4294967294
-2147483648	4294967295

      其公式为：
(n << 1) ^ (n >> 31)   //sint32
      (n << 1> ^ (n >> 63)   //sint64

需要补充说明的是，Protocol Buffer在实现上述位移操作时均采用的算术位移，因此对于(n >> 31)和(n >> 63)而言，如果n为负值位移后的结果就是-1，否则就是0。
注：简单解释一下C语言中的算术位移和逻辑位移。他们的左移操作都是相同的，即低位补0，高位直接移除。不同的是右移操作，逻辑位移比较简单，高位全部补0。而算术位移则需要视当前值的符号位而定，补进的位和符号位相同，即正数全补0，负数全补1。换句话说，算术位移右移时要保证符号位的一致性。在C语言中，如果使用 int变量位移时就是算术位移，uint变量位移时是逻辑位移。
（2）Non-varint数值型
double/fixed64始终都占用8个字节，float/fixed32始终占用4个字节。
（3）Strings
其类型值为2，key信息之后是字节数组的长度信息，最后在紧随指定长度的实际数据值信息。如：

message Test2 {
          required string b = 2;
      }

现在我们设置b的值为"testing"。其编码后数据如下：
12 07 74 65 73 74 69 6E 67
第一个字节0x12表示Key，通过解码可以得到字段类型2和字段标号2。第二个字节07表示testing的长度。后面7个红色高亮的字节则表示testing。

4、嵌入消息：
这里是一个包含嵌入消息的消息定义。

 message Test3 {
          required Test1 c = 3;
      }

此时我们先将Test1的a字段值设置为150，其编码结果如下：
1A 03 08 96 01
从上面的结果可以看出08 96 01和之前直接编码Test1时是完全一致的，只是在前面增加了key(字段类型 + 标号)和长度信息。新增信息的解码方式和含义与前面的Strings完全相同，这里不再重复解释了。

5、Packed Repeated Fields：
Protocol Buffer从2.1.0版本开始引入了[pack = true]的字段级别选项。如果设置该选项，那么元素数量为0的repeated字段将不会被编码，否则数组中的所有元素会被编码成一个单一的key/value形式。毕竟数组中的每一个元素都具有相同的字段类型和标号。该编码形式，对包含较小值的整型元素而言，优化后的编码结果可以节省更多的空间。如：

 message Test4 {
          repeated int32 d = 4 [pack=true];
      }

这里我们假设d字段包含3个元素，值分别为3,270,86942。编码结果如下：
      22             //key (字段标号4，类型为2)
      06             //数据中所有元素所占用的字节数量
      03             //第一个元素(varint 3)
      8E 02        //第二个元素(varint 270)
9E A7 05  //第三个元素(varint 86942)

十三、字段顺序

在.proto文件中定义消息的字段标号时，可以是不连续的，但是如果将其定义为连续递增的数值，将获得更好的编码和解码性能。

参考文章：https://www.ibm.com/developerworks/cn/linux/l-cn-gpb/index.html

你可能感兴趣的:(Protobuf)

2024 年最新 Protobuf 结构化数据序列化和反序列化详细教程唤醒手腕网络爬虫技术详细教程网络协议
Protobuf序列化概述Protobuf（ProtocolBuffers）是由Google开发的一种语言中立、平台中立、可扩展的序列化结构数据的方法。它用于在不同系统之间高效地交换数据。Protobuf使用定义文件（.proto）来描述数据结构，并通过编译生成特定语言的代码。它的优点包括小巧的二进制格式、高效的序列化速度和向后兼容性，非常适合需要高性能和跨语言的应用场景。常见序列化格式序列化格式
Protobuf在游戏开发中的应用：TypeScript + Golang 实践 qq_16827895 golang 游戏引擎服务器
Protobuf在游戏开发中的应用：TypeScript+Golang实践指南前言在游戏开发中，客户端与服务器之间的通信是核心功能之一。随着游戏复杂度的增加，传统的JSON通信方式在性能、数据大小和类型安全方面逐渐显现出不足。ProtocolBuffers（简称Protobuf）作为Google开发的数据序列化格式，以其高效的二进制编码、强类型定义和跨语言支持等优势，成为游戏开发中理想的通信协议选
Kitex v0.14.0 版本发布：支持流式泛化调用，优化排错体验后端
重要变更介绍新特性1.泛化调用：泛化Client支持流式调用，一个Client搞定流式/非流式调用场景泛化Client支持流式泛化调用，适配gRPC/TTHeaderStreaming并支持map/json和protobuf二进制泛化调用。简要代码示例如下：cli,err:=genericclient.NewClient("actualServiceName",g)//Ping-Pong泛化res
could not import google.golang.org/protobuf/proto ezreal_pan Go 后端 golang 前端开发语言
背景import("encoding/json""testing""google.golang.org/protobuf/proto")在测试中需要使用proto，但是，import这个包之后，一直报couldnotimportgoogle.golang.org/protobuf/proto这个错误，尝试了各种方法，依然没有解决这个问题。临时方案执行gomodvendor这个命令。项目的目录下多了
python 实战 grpc Avaricious_Bear python 开发语言
title:grpc|python实战grpcdescription:只要代码可以跑起来,很多难题都会迎刃而解.so,keepcodingandstayhungry.grpc的基础:protobufgrpchelloworld:python实战grpc环境配置grpcbasic:grpc4种通信方式grpc的基础:protobufgrpc使用protobuf进行数据传输.protobuf是一种数据
gRPC技术解析与python示例漫谈网络 NetDevOps 智联空间 python 开发语言 rpc grpc
一、gRPC核心架构1.多语言存根2.HTTP/2传输3.多语言实现生成生成客户端gRPC客户端库gRPC服务端库服务端业务逻辑ProtobufIDL二、成为「多语言RPC标准」的5大支柱1.语言无关的接口定义使用Protobuf作为接口定义语言（IDL）：//服务定义(hello.proto)syntax="proto3";serviceGreeter{rpcSayHello(HelloRequ
谷歌地图的3d街景使用的是什么数据格式？奇树谦 experience 3d 三维显示
文章目录一、3D街景（StreetView）1.图像部分2.元数据（Metadata）️二、3D城市模型（GoogleEarth或Maps的倾斜摄影模型）1.模型部分2.瓦片划分（TilingSystem）3.材质贴图注意与标准格式对比（参考）✅一、Google3DMesh使用的格式（Protobuf+Binary）1.**数据结构**2.**典型组成**✅二、glTF（GLTransmissio
RPC（Remote Procedure Call）技术解析漫谈网络 NetDevOps 智联空间 rpc 网络协议网络
一、RPC的本质定义核心理念：实现跨进程通信的透明化，让开发者像调用本地函数一样调用远程服务关键特征：1.发起本地调用2.序列化参数3.传输数据4.反序列化5.执行逻辑反向流程调用方客户端存根网络传输服务端存根服务实现返回结果二、核心工作原理（分层架构）1.客户端侧流程步骤组件关键操作1代理层生成服务接口代理对象2序列化层将参数对象转为二进制（Protobuf/JSON）3传输层建立网络连接（TC
Protobuf 与 JSON 的兼容性：技术选型的权衡与实践 Code季风探索 Protobuf：从入门到精通学习 json golang rpc python
在分布式系统和跨语言通信中，Protobuf和JSON是两种主流的数据序列化方案。尽管两者都能实现数据的编码和解码，但在兼容性、性能、开发体验等方面存在显著差异。以下从多个维度对比两者的兼容性特点，并结合实际场景给出选型建议。一、基础兼容性对比特性ProtobufJSON跨语言支持需要生成特定语言的代码（通过.proto文件）内置支持所有现代编程语言（无需额外工具）字段灵活性字段名和类型需严格定义
gRPC 与 Protobuf 的深度集成 —— 从服务定义到多语言交互（Go + Java 示例） Code季风探索 Protobuf：从入门到精通交互 golang java rpc 学习网络协议
在前几篇文章中，我们已经掌握了Protobuf的基础语法、高级特性和序列化反序列化操作。本篇文章将深入讲解gRPC与Protobuf的集成，重点介绍如何通过.proto文件定义服务接口，并在Go和Java中实现gRPC服务与客户端的完整交互流程。我们将通过详细代码示例和分步解析，帮助你彻底掌握微服务架构中的通信设计。一、gRPC简介与核心概念1.什么是gRPC？gRPC是一个高性能、开源的远程过程
别再裸写 parseFrom() 了！这才是 MQTT + Protobuf 消费的正确姿势！人工智能
本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师|全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优&车联网平台架构AIGC应用开发先行者|区块链落地实践者以技术驱动创新，我们的征途是改变世界！实战干货：编程严选网0前言很多刚接触这个技术栈的同学，可能会觉得有点绕。MQTT负责传输，Protobuf负责定义数据结构，听起来是天作之合，但具体
基础RAG实现，最佳入门选择（二）人工智能
初次创建embeddings向量安装相关依赖pipinstallsentence-transformerstorchprotobufsentencepiecepipinstallsentence-transformerstorchprotobufsentencepiecepipinstallsentence-transformerstorchprotobufsentencepiece代码froms
深入实战 —— Protobuf 的序列化与反序列化详解（Go + Java 示例） Code季风探索 Protobuf：从入门到精通学习 rpc go golang java 后端
在前两篇文章中，我们已经了解了ProtocolBuffers（Protobuf）的基本概念，并深入学习了.proto文件的语法结构、消息定义、字段规则等内容。本篇文章将进入实战阶段，重点讲解如何使用Protobuf进行数据的序列化和反序列化操作。我们将通过完整的示例，演示如何在Go和Java语言中使用Protobuf完成数据的编码与解码过程，并对比其性能优势，帮助你更好地理解Protobuf在实际
Protobuf 高级特性详解 —— 嵌套消息、Oneof 字段与自定义选项 Code季风探索 Protobuf：从入门到精通 json golang rpc java 学习
在前几篇文章中，我们已经掌握了ProtocolBuffers（Protobuf）的基础语法、.proto文件的结构、以及如何使用Go和Java进行数据的序列化与反序列化操作。本篇文章将深入探讨Protobuf的高级特性，包括：嵌套消息（NestedMessages）Oneof字段（OneofFields）Map类型（MapTypes）自定义选项（CustomOptions）向后兼容性设计与最佳实践
【protobuf】ProtoBuf——proto3语法详解、oneof类型、map类型、默认值、通讯录添加联系方式和备注的功能实现鳄鱼麻薯球 protobuf 网络开发语言 c++
文章目录ProtoBuf5.proto3语法详解5.5oneof类型5.6map类型5.7默认值ProtoBuf 5.proto3语法详解5.5oneof类型如果消息中有很多可选字段，但是将来只会有一个字段被设置，那么就可以利用oneof类型加强这一行为，也能有节约内存的效果。我们定义了一个名为other_contact的oneof字段，其中包含两个可选字段：qq和weixin。这两个字
ProtoBuf：proto3 语法详解 Zfox_ ProtoBuf ProtoBuf 中间件 c++
个人主页：Zfox_系列专栏：ProtoBuf在语法详解部分，依旧使⽤项⽬推进的⽅式完成讲解。这个部分会对通讯录进⾏多次升级，使⽤2.x表⽰升级的版本，最终将会升级如下内容：不再打印联系⼈的序列化结果，⽽是将通讯录序列化后并写⼊⽂件中。从⽂件中将通讯录解析出来，并进⾏打印。新增联系⼈属性，共包括：姓名、年龄、电话信息、地址、其他联系⽅式、备注字段规则消息的字段可以⽤下⾯⼏种规则来修饰：singul
Protobuf 数字类型选择策略：Int64 vs String 全方位分析后端
一、问题背景与核心矛盾在定义ProtobufRPC接口时，数字类型的选择会直接影响前后端开发体验和系统性能。以下是典型场景示例：messageAdRequest{//应该用哪种类型？int64ad_id=1;//方案Astringad_id=1;//方案B}矛盾焦点前端js/js等会自动将int64转为String类型示例：下面的字段business_value_id,前端得到的为String接口
Google 的 Protocol Buffers 介绍程序员乐逍遥 C++高手修炼营 C/C++多线程编程专题 C/C++网络编程专题后端 c++protobuffer 序列化
ProtocolBuffers（简称Protobuf）是由Google开发的一种高效、灵活、跨语言的数据序列化协议，广泛用于网络通信、分布式系统、持久化存储等场景。一、什么是ProtocolBuffers？ProtocolBuffers是一种结构化的数据交换格式，类似于XML和JSON，但更小、更快、更简单。它通过.proto文件定义数据结构，然后使用编译器生成代码，支持多种编程语言（如C++,J
protobuf遇到protoc-gen-go: unable to determine Go import path for “xxx“ Panda-gallery golang
问题这个错误是因为.proto文件中缺少必需的go_package选项。在protobuf生成Go代码时，这是关键配置项。panda@VM:~/dev/pb$protoc--go_out=.pb.protoprotoc-gen-go:unabletodetermineGoimportpathfor"pb.proto"Pleasespecifyeither:•a"go_package"optioni
Python gRPC 【RPC框架】简介老胖闲聊 Python库大全 python rpc 开发语言
gRPC是由Google开发的高性能、开源的远程过程调用（RPC）框架，而grpcio是其Python实现库。它使用ProtocolBuffers(protobuf)作为接口定义语言（IDL），支持跨语言通信，适用于微服务、分布式系统等场景。核心特点高性能：基于HTTP/2协议（多路复用、头部压缩、二进制传输）。使用ProtocolBuffers高效序列化（体积小、速度快）。跨语言支持：服务端/客
《炸裂！微服务开发竟藏这秘密！Go与Python靠gRPC实现毫秒级通讯》超级晒盐人百度 twitter
go服务与python服务之间进行数据交互,使用gRPC框架暴露服务,进行Protobuf交换后，对方服务收到Protobuf数据非必要无需转json,xml格式数据;go和python都可以直接通过预生成代码获取Protobuf中的键值信息不需要非得转化为json,xml格式数据,不必去解析json,xml的key值信息,这样传输效率更高，比httpresful快。解释几个名词gRPC‌：本质是
【学习笔记】Protobuf相关知识 HaiQinyanAN 工作中的学习笔记学习笔记 c++
【学习笔记】ProtobufProtocolBuffers（简称Protobuf）是由Google开发的跨平台、高效的数据序列化协议，用于结构化数据的存储和传输。它类似于JSON/XML，但具有更高的效率、更小的体积和更强的跨语言支持，广泛应用于微服务、分布式系统和移动应用的数据交互中。Protobuf通过二进制编码、自动代码生成和灵活的字段扩展机制，在性能、兼容性和开发效率上实现了多维突破。主要
解决protobuf: undefined reference to `google::protobuf::internal::fixed_address_empty_string[abi:cxx11 豆豆517929 疑难问题与解决 c++protobuf linux
问题在一个c++项目里用到了protobuf3.6.1，运用网上的安装方法后编译出现了这样的问题。原因总结所用的protobuf是旧版本的GCC(5之前的版本)所编译的，所以需要卸载后重新用新版本的编译一遍，如果有其他项目引用了旧版本的protobuf，就也不能用了。明明是新下载安装的protobuf，用的也是新的gcc，仍然有这样的问题。是因为在安装protobuf之前，其实系统里还有一个pro
python+gRPC上传超大文件【完整代码】我在北京coding python python
gRPC（gRPCRemoteProcedureCalls）是一个高性能、开源的通用RPC框架，由Google开发并基于HTTP/2协议标准和ProtocolBuffers（Protobuf）序列化协议设计。它支持多种编程语言，用于客户端和服务器之间的通信。核心特性：1.**基于HTTP/2**：-多路复用：在同一个连接上同时处理多个请求和响应，减少延迟。-双向流：支持客户端和服务器双向流式通信。
微信机器人逆向工程实践：DelChatRoomMember协议深度解析梦玄海微信 java 开发语言
一、背景与功能概述本文深入分析基于Go语言实现的微信机器人核心模块——群组成员删除协议的逆向工程实现。该模块涉及微信MMTLS加密通信、Protobuf协议封装、会话密钥管理等高级技术，完整实现了微信PC端删除群组成员的底层协议。本文面向具有逆向工程经验的技术专家，将重点解析协议构造、加密传输和响应处理等核心环节。二、协议架构解析2.1协议分层结构该实现遵循微信私有协议的分层架构：markdown
基于 Golang 实现微信收藏数据操作的同步、获取与删除功能梦玄网络安全微信
引言在现代互联网应用中，如何高效地管理用户的收藏数据，已经成为一个重要的功能需求。微信作为一款广泛使用的即时通讯应用，提供了丰富的接口来管理用户的收藏内容。在这篇技术博客中，我们将深入探讨如何通过Golang实现与微信收藏功能相关的操作，包括收藏同步（Sync）、获取收藏项（GetFavItem）以及删除收藏项（Del）等操作。我们会分析这些操作的背后实现，重点讨论如何利用Protobuf实现数据
Android中如何通过perfetto抓取trace
一，perfetto的作用Perfetto的作用是提供一个性能检测和跟踪分析工具集，用于Android、Linux和Chrome平台。Perfetto是Google推出的一款全新的平台级跟踪分析工具，它从Android10开始被引入，旨在替代之前的systrace工具。Perfetto的核心特点包括用户空间到用户空间的跟踪协议，基于protobuf序列化机制的数据填充到共享内存缓冲区，以及支持获取
Golang gRPC+Protobuf：高效序列化的秘密 Golang编程笔记 golang 开发语言后端 ai
GolanggRPC+Protobuf：高效序列化的秘密关键词：Golang、gRPC、Protobuf、高效序列化、RPC通信摘要：本文将深入探讨Golang中gRPC与Protobuf相结合实现高效序列化的奥秘。我们会先介绍相关的背景知识，包括gRPC和Protobuf的核心概念，再详细讲解它们的工作原理和架构，接着通过代码实例展示如何在实际项目中运用，最后探讨其实际应用场景、未来发展趋势与挑
Protobuf——Protocol Buffer详解（2）菜鸟康服务器运维
目录一、前言二、共识与协议三、信息的编解码1、纯文本形式2、XML3、protobuf四、Protobuf的编码原理1、变长编码1.1有符号数的表示2、字段名称与字段类型2.1字段类型2.2字段名称五、Protobuf编码结构五、总结一、前言上篇文章中介绍了protobuf的使用，下面我们深入了解以下protobuf的原理，它是怎么实现高效的序列与反序列化的。首先我们需要先回答一个问题：对于运行在
探索 protoc-gen-gotag：为protobuf消息添加灵活性的利器
探索protoc-gen-gotag：为protobuf消息添加灵活性的利器protoc-gen-gotagAddcustomstructtagstoprotobufgeneratedstructs项目地址:https://gitcode.com/gh_mirrors/pr/protoc-gen-gotag项目介绍在微服务和分布式系统日益普及的今天，ProtocolBuffers（简称protob
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多