在我的职业生涯中经常发现,通过了解在特定情况下 不应该做什么,可以学到更多知识。例如,在我职业生涯的早期,由于需要快速发布软件,我省略了单元测试,因为我认为不值得做这些工作。幸运的是,我已经学到 绝不应该将未经测试的代码投入生产;因此开始坚持编写单元测试。
整个 IT 行业似乎都主要采用这种学习方式;实际上,我们甚至专门创建了 反模式(anti-pattern)这个词,表示在特定环境中不应该采用的做法。反模式是看起来似乎有好处,但是最终可能产生严重影响的解决方案。
看似真实的假象
遗憾的是,我发现当缺少经验的团队试图采用 CI 时,他们很可能错误地采用许多反模式,这最终导致他们不但没有获得预期的好处,反而遇到一大堆麻烦。不幸的是,在这种情况下,团队常常将麻烦归罪于 CI 本身。因此,我常常听到 “CI 不适合大项目” 或 “我们的项目 太特殊,不适合采用 CI” 这样的说法,实际上 CI 根本不是问题的原因 —是某些做法的不恰当应用或者缺少某些方法导致了这些麻烦。
在本文中,我要描述与 CI 相关的六个反模式:
- 签入不够频繁,这会导致集成被延迟
- 破碎的构建,这使团队无法转而执行其他任务
- 反馈太少,这使开发人员无法采取纠正措施
- 接收 垃圾反馈,这使开发人员忽视反馈消息
- 所拥有的 机器缓慢,这导致延迟反馈
- 依赖于 膨胀的构建,这会降低反馈速度
如果您采用 CI 的时间足够长,那么几乎肯定体验过这些反模式的效果。这没关系,但是如果它们发生得太频繁,就会大大限制 CI 的好处。因此,如果您希望避免这些反模式并控制它们的负面影响,那么本文正适合您。
回页首
由于签入不够频繁导致的延迟集成
名称:签入不够频繁
反模式:由于所需的修改太多,源代码长时间签出存储库。
解决方案:频繁地提交比较小的代码块。
实施 CI 的前提是团队可以快速获得关于当前开发的代码的反馈;而且,与传统的集成相比,这种频繁的软件集成风格会减少集成花费的时间(和麻烦)。但是,有效的 CI 假设修改会频繁地发生(所以可以频繁地执行构建!)。如果代码长期留在开发人员的桌面(而不是存储库)中,那么就会出现糟糕的情况,因为在系统的不同部分中会出现其他修改。
从本质上说,如果不频繁地提交修改,集成就会延迟;延迟越长,消除其严重影响就越困难(比如其他人的修改可能会影响您的代码)。对于使用 CI 的项目,我建议开发人员 至少每天签入一次代码,但是我相信最好是每天签入多次。
任务越小,工作越轻松
我常常听到一些开发人员抱怨说,他们要忙于修改那么多文件,哪有精力每天签入代码。实际上,这正是我要说的要点 —为了每天提交源代码修改,需要将任务划分得更小。实际上,需要将编程任务划分成小块,这样修改也会更小。
不要在一个大任务中实现一个业务对象上的所有特性,例如编写 read()
、write()
、update()
和 delete()
方法的原型;而是应该首先编写 read()
方法(以及对应的测试),然后签入这个类,从而与整个代码基集成。接下来,可以实现另一个方法,再次执行签入,直到完成整个任务。这样的话,就可以让 CI 的好处最大化,而且会让您确信自己的代码可以与 别人的代码相互配合。
请记住,即使您和您的团队正确地执行许多 CI 实践,如果团队成员不坚持至少每天签入一次源代码修改,那么 CI 的好处会大打折扣。这常常会让人误以为 CI 是无效的,这种想法实在大错特错。
回页首
破碎的构建减慢了开发的节奏
名称:破碎的构建
反模式:构建长时间破碎,导致开发人员无法签出可运行的代码。
解决方案:在构建破碎时立即通知开发人员,并以最高优先级尽快修复破碎的构建。
无论您信不信,构建破碎的时间越长,就越麻烦。这是因为文件、修改和依赖项越多,隔离缺陷就越困难。因此,当通知某人构建破碎时(通过电子邮件、RSS 或其他机制),他应该优先解决这个问题;否则,构建破碎的时间越长(尤其是对于频繁修改代码的团队),就越难纠正。
破碎的构建不总是坏事。实际上,破碎的构建会让您迅速地意识到软件出了问题。当构建 频繁地破碎或长时间破碎时,破碎的构建就会成为问题。在构建破碎的情况下,绝不应该置之不理。
用私有构建减少破碎的构建
防止破碎构建的有效技术之一是,在将代码提交到存储库之前,运行私有构建(private build)。执行私有构建的步骤如下:
- 从存储库签出代码。
- 在本地修改代码。
- 用存储库执行更新,从而集成其他开发人员所做的修改。
- 运行本地构建。
- 构建成功之后,将修改提交到存储库。
图 1 说明了这种做法。注意,这个工作流强调频繁地与存储库执行同步,从而保证定期签入并限制破碎的构建 —这真是一举两得!
图 1. 运行私有构建减少破碎的集成构建
通过在签入源代码之前执行私有构建(当然是频繁地执行),可以避免许多导致构建破碎的典型错误;因此,可以节省时间和减少麻烦。
回页首
由于反馈太少,无法采取纠正措施
名称:反馈太少
反模式:团队没有把构建状态通知发送给团队成员;因此,开发人员不知道构建已失败。
解决方案:使用各种反馈机制传播构建状态信息。
在设置 CI 系统时,团队常常认为接收电子邮件是浪费时间;因此,他们决定不发布通知。但是,如果没有对构建的反馈,就无法采取纠正措施。实际上,反馈是 CI 最重要的方面之一;因此,反馈是否 有效也非常关键。
如果希望扩展将构建状态信息发布给团队成员的机制,那么使用视觉和声音设备可能很有帮助,对于集中工作的团队尤其如此。Ambient Orb 这样的设备可以几乎实时地反映构建的状态。例如,当构建失败时,orb 可以显示红色;当构建通过时,orb 显示绿色。另外,orb 还可以传播其他信息,例如通过改变颜色表示代码库的复杂性是增长还是下降(比如绿色表示良好,黄色表示糟糕)。
发挥创造力
设置 Ambient Orb 非常容易。清单 1 演示如何使用 Quality Lab 的开放源码软件 OrbTask
在 Ant 中设置 Ambient Orb:
清单 1. 使用 Ambient Orb Ant 任务
<target name="notifyOrb" > <taskdef classname="org.qualitylabs.ambientorb.ant.OrbTask" name="orb" classpathref="orb.class.path"/> <orb query="http://myambient.com:8080/java/my_devices/submitdata.jsp" deviceId="AAA-9A9-AA9" colorPass="green" colorFail="red" commentFail="Code+Duplication+Threshold+Exceeded" /> </target> |
清单 1 中的任务对于通过状态将 orb 改为绿色,对于失败状态显示红色。图 2 显示绿色的 orb,这表示最近的构建状态是成功:
图 2. 成功的构建!
团队可以创造性地使用各种反馈机制,让团队成员不会忽视构建状态消息。另外,这些技术也会让 CI 变得生动有趣,让人们更容易注意到需要采取措施的问题。
其他通知机制包括:
- RSS feed
- 任务栏监视器,比如 CCTray(用于 CruiseControl)
- X10 设备(比如 LavaLamps)
- 通过 Jabber 等发送的即时消息
- SMS(Text Messages)
警告:需要在信息过多和信息过少之间找到一个平衡点。反馈机制应该随着工作环境定期调整。例如,对于集中工作的团队,声音提示可能是有效的(比如在构建失败时发出火灾警报);但是,其他团队可能更喜欢 Ambient Orb(它不会在您陷入沉思时吓着您)。
回页首
垃圾反馈
名称:垃圾反馈
反模式:团队成员很快被构建状态消息淹没(成功、失败或界于这两者之间的各种消息),所以开始忽视这些消息。
解决方案:反馈要目标明确,使人们不会收到无关的信息。
与 “反馈太少” 反模式相反,我常常发现团队天真地认为,当 CI 服务器做任何事情时,每个人都应该接到反馈(比如电子邮件)。信息一旦泛滥,人们就会忽视它们;如果反馈太多,团队很快就会将 CI 反馈看做垃圾。所以,当发生真正严重的问题(比如构建真的破碎了)时,可能无法引起注意。
通过精确地确定反馈的目标,尽可能减少垃圾反馈
清单 2 给出一个 CruiseControl 配置文件示例,演示如何有效地使用电子邮件通知。在这个示例中,无论构建是成功还是失败,技术主管都会收到电子邮件,项目经理只在构建失败时收到电子邮件,最近向存储库提交源代码修改的开发人员也会收到通知。
清单 2. 使用 CruiseControl 发送电子邮件通知
<project name="brewery"> ... <publishers> <htmlemail css="./webapps/cruisecontrol/css/cruisecontrol.css" mailhost="localhost" xsldir="./webapps/cruisecontrol/xsl" returnaddress="cruisecontrol@localhost" buildresultsurl="http://localhost:8080" mailport="25" defaultsuffix="@localhost" spamwhilebroken="false"> <always address="techlead@localhost"/> <failure address="pm@localhost" reportWhenFixed="true"/> </htmlemail> </publishers> ... |
反馈是 CI 系统最重要的方面之一,值得好好讨论一下。反馈太少和 垃圾反馈是两个极端,要在它们之间找到一个适当的平衡点。当构建破碎时,必须及时地将反馈发送给适当的人,而且必须提供采取纠正措施所需的信息。如果构建是成功的,那么应该只向少数人发送反馈,包括最近提交修改的开发人员以及希望掌握最新情况的技术领导。如果不加区分地把所有状态消息发送给所有人,肯定会大大损害 CI 过程的效果。
回页首
不要让缓慢的机器导致反馈延迟
名称:缓慢的机器
反模式:用一台资源有限的工作站执行构建,导致构建时间太长。
解决方案:增加构建机器的磁盘速度、处理器和 RAM 资源,从而提高构建速度。
几年前,我参与了一个相当大的项目,它有超过一百万行代码,编译需要花两个小时以上。当我们试图更频繁地执行集成时,等待持续管理团队执行集成的时间越来越长,让人很不耐烦。当然,两个小时其实是最好的情况,因为构建常常失败,所以这个过程常常要花几 天(真是痛苦啊!)。这种情况持续几周之后,解决方案就非常明确了:必须购买一台更强大的机器,它的磁盘空间必须足以容纳所有要签出的文件和构建生成的文件,它的处理器速度更快,可以处理许多指令,RAM 数量要足以运行测试和其他需要大量内存的进程。
您觉得需要提高速度吗?
有了这台强大的机器,我们将构建时间从两个小时降低到了 30 分钟;所以,通过花费额外资金购买最新的机器,我们节省了大量时间和金钱,而且最终能够更快地集成软件(这意味着更快地发现问题!)。
用更强大的工作站执行集成构建总是没错的;但是,这个故事的要旨在于,如果发现构建机器在速度、内存或硬盘方面无法让人满意,就应该认真考虑进行升级;加快构建可以帮助我们更快地获得反馈,快速纠正问题,更快地转到下一个开发任务。
回页首
膨胀的构建导致反馈延迟
名称:膨胀的构建
反模式:把太多的任务添加到提交构建过程中,比如运行各种自动检查工具或运行负载测试,从而导致反馈被延迟。
解决方案:一个构建 管道(pipeline)可以运行不同类型的构建。
一些开发团队喜欢把能添加的所有过程都添加到自动构建中,但是他们忘了执行这些操作是要花 时间的。还记得吗?我遇到的那个项目的编译要花两个小时。想像一下,如果把执行测试添加到构建过程中,会怎么样呢?对于一百万行代码,您认为运行静态分析工具要花多长时间?如果您认为耗时八小时的构建过程是难以令人置信的,那么再想想吧。我经常遇到这种情况。
为了向团队成员提供更多的构建信息,团队往往会逐渐增加构建过程的内容。要向开发团队提供快速反馈,还要从 CI 构建过程提供有用的信息,必须在这两个目标之间取得平衡。
通过构建管道提高效率
如果发现构建过程耗时太长,而且已经实现了其他改进技术(比如改用更快的机器)并优化了测试执行时间,那么就有必要考虑创建所谓的 构建管道(build pipeline)。构建管道的用途是异步地执行长时间运行的过程,这样的话,开发人员签入代码之后,不需要长时间等待反馈。
例如,如果执行一个构建过程要花 10 分钟以上,那么可以创建一个构建管道,在某人将代码提交到存储库之后,它会运行一个初步的轻型构建。这个 “提交” 构建由编译和运行快速单元测试等轻型过程组成。如果这个初步构建成功了,就可以运行第二个构建,它执行长时间运行的测试、软件检查,甚至包括部署到应用服务器上。
例如,在清单 3 中,让 CruiseControl 检查存储库中的修改。当发现修改时,CruiseControl 运行一个所谓的 委派(delegating)构建,它调用项目的主构建文件(在使用 Ant 时是 build.xml)。但是,特殊之处是 CruiseControl 执行另一个目标,这个目标执行一些轻型过程,比如编译和细粒度的单元测试。
清单 3. 检查修改的 CruiseControl 配置
<project name="brewery-commit"> ... <modificationset quietperiod="120"> <svn RepositoryLocation="http://brewery-ci.googlecode.com/svn/trunk"/> </modificationset ... |
在清单 4 中,CruiseControl 检查对 brewery-commit
项目的修改(这个项目不在存储库中 —它实际上查看一个日志文件)。当发现修改时,CruiseControl 运行另一个委派构建。这个构建调用相同的构建文件,但是执行另一个目标。这个目标可能执行长时间运行的过程,比如功能测试、软件检查等等。
清单 4. 执行长时间运行的构建的 CruiseControl 配置
<project name="brewery-secondary"> ... <modificationset quietperiod="120"> <buildstatus logdir="logs/brewery-commit"/> </modificationset> ... |
膨胀的构建反模式是导致 CI 无法实施的最常见原因。但是,正如您看到的,使用构建管道可以避免这种情况。有效的构建管道应该充分利用 “80/20” 规则:百分之 20 的构建时间花费在导致百分之 80 的构建错误(比如缺少文件、破碎的编译和测试失败)的部分上。完成这个过程之后,开发人员接到反馈,然后运行第二个构建过程,这个过程的运行时间比较长,但是只产生百分之 20 的构建错误。
回页首
反模式是可以纠正的
CI 反模式会妨碍团队从持续集成实践中获得最大的收益;但是,本文描述的技术有助于限制这些反模式发生的频率。这些技术包括:
- 经常提交代码,可以防止集成变得复杂。
- 在提交源代码之前运行私有构建,可以避免许多破碎的构建。
- 使用各种反馈机制避免开发人员忽视构建状态信息。
- 有针对性地向可以采取措施的人发送反馈,这是将构建问题通知团队成员的好方法。
- 花费额外资金购买更强大的构建机器,从而加快向团队成员提供反馈的速度。
- 创建构建管道来缓解构建膨胀。
本文描述了我最常遇到的一些反模式,但是还有其他反模式,包括:
- 持续忽视(Continuous Ignorance),也就是构建过程只包含很少的过程,导致构建总是成功。
- 构建 只在您的机器上执行,这会延长引入缺陷和纠正缺陷之间的时间。
- 瓶颈提交(Bottleneck Commits),这会导致破碎的构建,让团队成员无法回家。
- 运行 间歇构建(intermittent build),这使反馈延迟。
明年我会讨论其他影响持续集成效果的 CI 反模式,请保持关注。
参考资料
学习
- 您可以参阅本文在 developerWorks 全球站点上的 英文原文。
- Continuous Integration: Improving Software Quality and Reducing Risk (Paul Duvall 等,Addison-Wesley Signature 系列,2007 年):了解不同语言和平台中超过 40 种 CI 实践。
- “通过持续集成尽早发现缺陷”(Andrew Glover,developerWorks,2007 年):在这个教程中,Andrew Glover 介绍持续集成的基本方面,并介绍如何使用最好的开放源码技术设置 CI 过程。
- “Continuous Integration”(Martin Fowler,martinfowler.com):Fowler 的这篇文章首次提出了持续集成的概念。
- “让开发自动化 : 持续反馈”(Paul Duvall,developerWorks,2006 年 11 月):学习如何立即获得对每个源代码修改的反馈。
- “Is Pipelined Continuous Integration a Good Idea?”(infoq.com,2007 年 9 月):了解 CI 在构建管道中的作用。
- 让开发自动化 (Paul Duvall,developerWorks):阅读整个系列。
- developerWorks Java™技术专区:这里有数百篇关于 Java 编程的文章。
获得产品和技术
- Ambient Orb Ant 任务:使用这个 Ant 任务根据构建状态改变 Orb 的颜色。
讨论
- Improve Your Code Quality 讨论论坛:developerWorks 文章作家 Andrew Glover 将其丰富的专家知识带入这个论坛,主要在提高代码质量方面提供咨询。
- developerWorks space: Accelerate development:developerWorks 文章作者 Andrew Glover 在此开设了一个一站式的门户,其中包括与开发人员测试、持续集成、代码度量和重构相关的各种内容。
关于作者
Paul Duvall 是 Stelligent Incorporated 的 CTO,该公司是一家咨询公司,在帮助开发团队优化 Agile 软件产品方面被认为是同行中的翘楚。他是 Addison-Wesley Signature 系列书籍 Continuous Integration: Improving Software Quality and Reducing Risk (Addison-Wesley,2007 年)的作者之一。他对 UML 2 Toolkit (Wiley,2003 年)和 No Fluff Just Stuff Anthology (Pragmatic Programmers,2007 年)也有贡献。
为本文评分
平均分 (7个评分)