“时下的IDE很多都是极其优秀的,拜其所赐,职场上的程序员多出十几倍,但是又有多少能理解程序内部的机制呢?”——侯捷
随着软件技术的发展及其在各个领域的广泛应用,对软件进行逆向工程,然后通过阅读其反汇编代码来推断其数据结构、体系结构和程序设计思路的需求越来越多。逆向工程技术能帮助我们很好地研究和学习先进的软件技术,特别是当我们非常想知道某个软件的某些功能究竟是如何实现的,而手头又没有合适的资料的时候。
我国的软件产业落后于西方,甚至在某些方面落后于邻国的印度和日本。如果我们能够利用逆向技术去研究国外的一些一流软件的设计思想和实现方法,那么我国的软件技术将会得到极大的提升。目前,国内关于逆向分析技术的资料实在是少之又少,大中专院校的计算机相关专业对此项技术也尚未有足够的重视。
有很多人认为研究程序的内部原理会破坏“黑盒子”封装性,但是如果我们只是在别人搭建好的平台上做开发,那么始终只能使用别人提供的各种未开源的SDK,会一直被别人的技术牵制着。如果我们能够充分掌握逆向分析的方法,就可以洞悉各种SDK的实现原理,学习各种一流软件所采用的先进技术,取长补短,为我所用。若能如此,实为我国软件产业之幸。
我当初学习逆向技术时完全靠自学,且不说这方面的书籍,就连相关的文档和资料也都极度匮乏。在这种条件下,虽然在很努力地钻研,但学习进度却非常缓慢,花费几天几夜完成对一个软件的关键算法的分析是常有的事。如果当初有一本全面讲解反汇编与逆向分析技术的书供参考,我当年不仅能节省很多时间和精力,而且还能少走很多弯路。因为有这段经历,我斗胆争先,决定将自己多年来在反汇编与逆向分析技术领域的一些经验和心得整理出来与大家分享,希望更多的开发人员在掌握这些技术后能更好地将其应用到软件开发的实践中,从而提高我国软件行业的整体水平。由于个人能力有限,书中的疏漏在所难免,还请各位同行和读者多多批评和指正。
首先,无论大家从事哪个行业,在开始阅读本书之前,都需要具备以下几个方面的基础知识:
具备了上面这些基础知识,就能根据自己的实际需求来学习本书的内容。
如果你是一位软件研发人员,你将通过本书更深入地了解C++语法的实现机制,对产品知其然更知其所以然,能够在熟练阅读反汇编代码后,使调试技术也有质的提升。如果你是一位反病毒分析或者电子证据司法取证分析人员,通过逆向恶意软件样本,可以进行取证分析处理,例如,可以归纳开发者的编写习惯,推定开发者的编程水平,甚至可以进一步判定某病毒样本是否与其他某些病毒为同一作者所为。
如果你是高等院校计算机相关专业的教师或学生(本科或本科以上),软件逆向分析技术可以给你带来崭新的职业空间,使你有足够的技术竞争力面对软件研发行业。同时,信息安全行业也会是你新的求职方向。
在本书的内容结构上,笔者结合自己的学习经历和对C++反汇编与逆向分析技术的了解进行了较为周详的设计,将全书划分为三个部分。
第一部分 准备工作(第1章)
在软件开发过程中,程序员会使用一些调试工具,以便高效地找出软件中存在的错误。在逆向分析领域,分析者也要利用相关的工具来分析软件行为和验证分析结果。本书第一部分简单介绍了几款常用的逆向分析辅助工具和软件。
第二部分 C++反汇编揭秘(第2~13章)
如果要评估一位软件开发者的能力,一是看设计能力,二是看调试水平。一般来说,大师级的程序员对软件逆向分析技术的理解都很深入,他们在编写高级语言代码的同时,心里还会浮现出对应的汇编代码,他们在写程序时就已经非常了解最终产品的真正模样,达到人机合一的境界,所以在调试Bug的时候游刃有余。逆向分析技术重在代码的调试和分析,如果你本来就是一个不错的程序员,学习这部分内容就是对你“内功”的锻炼,这部分内容可以帮助你彻底掌握C/C++的各种特性的底层机制,不仅能做到知其然,而且还能知其所以然。这个部分以C/C++语法为导向,以VC++ 6.0为例,解析每个C/C++知识点的汇编表现形式,通过整理其反汇编代码来梳理其流程和脉络。这部分内容重在讲方法,授人以渔,不重剑招,但重剑意。如果大家照此“精修”,可达到看反汇编代码如同看武侠小说的境界。
第三部分 逆向分析技术应用(第14~17章)
这是本书的最后一部分,以理论与实践相结合的方式,通过对具体程序的分析来加深大家对前面所学理论知识的理解,从而快速积累实战经验。第14章分析了PE文件分析工具PEiD的工作原理;第15章对“熊猫烧香”病毒进行了逆向分析;第16章分析了调试器OllyDBG的工作原理;第17章讲解了反汇编代码的重建与预编译。通过对这部分内容的学习,大家可以通过实际应用领略逆向分析技术的魔力。
逆向分析技术具有很强的综合性和实践性,要掌握这项技术需要耐心和毅力。建议大家从最简单的程序入手,按照本书安排的顺序逐章阅读,在学习的过程中逐步提高难度,一边看书,一边积极思考和总结。对于一些理论知识,如果你兴趣不大,在初学阶段可以跳过,待以后需要提高时再回过头来阅读,可以暂时跳过的知识我都在书中做了说明。
随着时间的积累,你会逐渐形成一套属于自己的分析代码的风格和习惯。这样一来,任何软件在你眼中都没有了神秘感。
本书的讨论和勘误建立在看雪安全论坛(http://bbs.pediy.com/)的图书项目版块中,我们会在这里发布本书的勘误和其他对大家有用的增值服务。大家也可以在这里发表对本书的意见和建议,更重要的是,大家还能在这里结交到一些志同道合的朋友。同时,也欢迎大家直接通过QQ(159262378)或E-mail([email protected])联系我,由于平时上网较少,如果回复不及时,还请谅解。
在本书写作的过程中,我得到过很多从事逆向分析技术的同行的指点和帮助,在此表示感谢,其中一部分包括段钢、姚辉、彭国军、雷建云、林子深、印豪、单海波、王清、谭文、邵坚磊、田阗、方志强、岳磊、余坦兮、李长坤、曹剑锐、胥国银、胡晓春、吕明坤、张慧等(排名不分先后)还有很多朋友在我写作本书的过程中给予了帮助,这里一并表示感谢。
特别感谢本书的策划编辑杨福川和责任编辑姜影,他们花费了许多时间和精力来校正本书中的各类错误。正是他们的敬业和努力,才使得本书能在保证质量的前提下顺利出版。
2011.7于武汉
【作者简介】
钱林松,资深安全技术专家、软件开发工程师和架构师,从事计算机安全和软件开发工作12年,实践经验极其丰富。尤其精通软件逆向分析技术,对C/C++技术和Windows的底层机制也有非常深入的研究。武汉科锐软件技术有限公司创始人,教学经验丰富,多年来,为国内计算机安全领域培养和输送了大量的人才。活跃于看雪论坛,有较高的知名度和影响力。