奔啵儿鮁

多年C++开发使用经验总结

摘要

借着公司内和其他小组的一个分享，把自己几年来C++开发的一点思考总结一下。全篇没有高屋建瓴的观点，基本都是些细节方面的注意事项。希望能给大家提供一点帮助。

构建工具

C/C++世界里有不少的构建工具：make、autotools、scons、CMake、Bazel。但近几年比较流行的，也就是CMake和Bazel。所以这一部分，也就大概对比下这两个工具吧。

究竟该选择哪个工具，我觉得可以从如下几个方面来对比一下：

1、上手难度

因为Bazel采用了类似Python的语法，所以其学习曲线相比CMake要平缓一些。但当我们考虑上手难度时，除了学习曲线之外，还要考虑文档的完备性、该工具的通用性等各个角度。当综合考虑时，我觉得CMake是一个尽管保守但仍旧不错的选择。主要原因就在于，CMake几乎已经成为现在C++的事实标准。使用CMake，就意味着：

你可以把你熟悉CMake的技能用在折腾别的C++项目上。而这点之所以重要，是因为你在利用某个第三方库的时候，往往需要大概研究下它的编译过程。

CMake的官方文档和stackoverflow上的问答也比较完善。一旦遇到一个问题，往往通过搜索引擎能快速的得到答案。

另外，从设计理念上来看，CMake提供的解决方案是改革式的：它并没有提供一个全新的解决方案，而是和Make、Visual Studio或者其他现有的构建工具来结合使用的。而这就使得你无需丢弃在其他工具上所积累起来的开发经验——例如你熟悉make工具，哪怕是一个CMake维护的项目，你也可以毫不费力就知道如何来查看编译参数，以及控制编译并发度等等。

而对于Bazel则不是如此。Bazel完全以革命者的姿态完整提供了一整套解决方案，所有的使用细节你都要从头开始。加上文档的匮乏，这就使得你也得花上一段时间，才能熟悉Bazel。

2、thirdparty的管理

Bazel内置了对thirdparty源码级别依赖的支持https://docs.bazel.build/versions/master/external.html：

thirdparty可以是用Bazel构建的，也可以不是。对于非Bazel项目，你需要额外为其添加一个Bazel的描述文件。

thirdparty可以是一个本地项目，也可以是一个git仓库或者http链接

所以总的来看，Bazel对thirdparty支持还是非常友好的。

就这点对比来看，CMake其实做的是不太好的。CMake尽管也有ExternalProject https://cmake.org/cmake/help/latest/module/ExternalProject.html的feature，但根据实际经验来看，使用和维护都比较的复杂。所以我还是更倾向于写几个脚本来下载和编译这些thirdparty依赖。

这里可以拿我参与维护的Pegasus https://github.com/XiaoMi/rdsn/tree/master/thirdparty项目为例。在该项目中，我们依赖了几个不同类型的项目：

从构建工具上来看，这些依赖有使用CMake的，有使用make的，有使用autotools的

从来源上来看，有的依赖来自git仓库，有的来自http链接，有的则是从一个大的项目里面挑选了一个更小的模块使用

从代码的使用方式上来看，有的是直接拿来用，有的还需要稍微修改下源代码。

而通过shell脚本，这些各种各样的场景我们都能非常方便、直接、易维护的得以支持。

3、其它

Bazel和CMake当然还有些其它方面值得对比，但并非一些通用的点，这里就简单列举下，不再详细展开了：

IDE集成

缓存编译结果，从而加速编译过程

多语言混合变成的支持

分布式编译

跨平台的支持

再补充一个别人的讨论Q群：731611386

编程规范

强烈推荐Google C++ Style：https://google.github.io/styleguide/cppguide.html。尽管它禁止了很多C++ feature而被很多人黑的很惨，但从工程的角度而言，它的确提供了非常多极其中肯的建议。说到底，编程规范的存在，主要就是可以让水平参差不齐的工程师们，可以在一起协作出风格较为一致的项目来。

也存在一些工具可以对google规范进行检查：

clang-format https://clang.llvm.org/docs/ClangFormat.html

cpplint https://github.com/cpplint/cpplint

因为google的规范文档对C++ feature的取舍原因讲的非常好，这里就不再赘述了。唯一想补充的是异常：

C++在语法层面对异常支持不太友好：你无法通过函数签名来得知一个函数到底会抛出哪些异常。例如：

void GetSomeResource(const char* resource_name);

如果这个接口没有良好文档或注释，并且也没有代码可翻时，你在调用这个接口时很有可能会漏掉一些错误情况——因为它可能抛出异常。更要命的是，一个疏于捕获的异常一旦触发，线上的程序就会crash。

其实解释这么多，大家只要和Java中的异常机制对比一下，就高下立判了。对于这个话题，王垠的这篇博客http://www.yinwang.org/blog-cn/2017/05/23/kotlin值得一看的。

在运维Pegasus项目时，遇到过一个老版本glibc的bug：如果多个线程同时抛出异常，程序会陷入死循环。这个bug的发现也是个有趣的过程，后面我专门写篇文章展开吧。

在禁用异常后，程序就只能用错误码来进行错误处理。对于很多项目，大家都采用一套类似的范式，可以参考tensorflow的做法https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/lib/core/status.h

C++的新特性

如果能使用C++的新特性，当然是尽量使用的好。我自己在开发中，觉得非常方便必须使用的新特性有：

智能指针

右值，以及C++14中右值得capture

lambda, bind

initialize list

想补充说一下的是auto，我自己不是特别喜欢这个feature，也非常赞同google规范中的对auto的限制：仅当可以提高代码可读性时，使用auto

这里不由得就想扯起java 10中的var。虽然能方便开发，但觉得更多的是会被滥用。而一个可能被滥用的feature，还不如没有的好。

第三方utility

在做项目开发的时候，一般会有很多琐碎的需求，从而也需要很多utility工具包。这里把我遇到的一些需求整理一下：

算法和数据结构：stl, boost

错误码管理：参见tensorflowhttps://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/lib/core/status.h

C语言的字符串封装：string_view https://github.com/abseil/abseil-cpp/blob/master/absl/strings/string_view.h

字符串的各种操作、转换、打印：可以多翻翻abseil https://github.com/abseil/abseil-cpp, 以及folly https://github.com/facebook/folly，另外也推荐fmtlibhttps://github.com/fmtlib/fmt

线程安全的、无锁的数据结构、线程池: folly

google全家桶：gtest，gflags, glog, protobuf, grpc

最后，也推荐下kudu这个项目，里面有自己实现的一些工具包https://github.com/cloudera/kudu/tree/master/src/kudu/util，以及对google开源项目中utility的整理https://github.com/cloudera/kudu/tree/master/src/kudu/gutil。

单元测试

每个程序员都讨厌写测试。就我自己而言，我觉的单元测试的目的有以下几个：

确保功能的实现和预期一致

防止程序在重构的时候出问题

给模块的使用者，提供使用示例

值得一提的是，对于C++项目，除了功能性测试之外，你最好还能让你的单元测试通过一些自动化工具的检测，如：

valgrind：检查内存泄露，以及非法访存

Address Sanitizer：检测非法访存https://github.com/google/sanitizers/wiki/AddressSanitizer

Thread Sanitizer：检测线程竞争https://clang.llvm.org/docs/ThreadSanitizer.html

写在最后

自己的整理这些内容时，脑子里反复萦绕的一个问题是：我们在开发一个项目时，所要遵守的各种流程和规范到底是不是真的有必要的？说的更直白一点就是，“代码洁癖”这东西到底有没有意义？

我的看法是：代码洁癖不是一个原则，而是在投入和产出上的一种权衡。如果仅仅快速试错，那么就不需要维持代码洁癖，因为你完全不知道你今天写的代码究竟能存活多久。而如果是一个马拉松式的项目，代码洁癖就值得维持，因为它对于项目的维护的确很有意义。

最后，贴一个C语言学习交流群：731611386

你可能感兴趣的:(IT)

java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include