首先,开始接触Chrome的童鞋可能有一个疑惑,Chrome和Chromium是同一个东西吗?答案是,Chrome是Google官方的浏览器项目名称,Chromium是Google官方对Chrome开源项目。说白了就是Chrome是Google自己的官方浏览器版本,而Chromium是开源项目,所有有兴趣的开发者都可以参加,Chromium中出现的新技术如果经过测试是可靠的,健壮的,那么将可能会出现在未来发布的Chrome官方版本中。因此,Chrome版本更新速度要远远小于Chromium的更新速度。
在本文中,笔者为了偷懒,直接用项目名称Chrome指代Chromium,废话不多说了,开始为潜入Chrome源代码的海洋作准备了。
Chrome项目是一个非常庞大的项目工程,包含的工程(Project)数量超过了500个,全部代码加在一起超过4G,全部编译完成将消耗将近30G的磁盘空间,不愧为恐龙级别的软件项目工程。面对Chrome浩如烟海的源代码,我们怎么读呢?很显然,一个文件一个文件的看,逐行分析是不现实的,我们必须先从整体来把握整个Chrome工程,然后逐步细化去了解每个具体模块的功能,并且对你所感兴趣的部分模块进行最后的深入分析。
分析任何一个大型软件项目的源代码,我们首先要做的事是参考官方文档(如果有的话),对项目的源代码目录树进行分析。通过对源代码树的分析,我们可以很快掌握项目中各个工程之间的依存关系,了解项目中每个模块的大致功能,并且可以很快地找到源代码分析的入口点。
下面图1所展示的是在Visual
图1
app:应用平台代码,与国际化有关,此该目录中的工程源代码是和主流操作系统平台相关的系统应用代码。正对不同操作系统,提供了不同的c++实现文件。例如:剪贴板板调用、操作系统数据交换接口、系统资源管理等。
base:基础设施代码,此目录包含了一些公用库,包含大量的框架代码的实现,比如进程、线程以及消息循环的封装,对字符串的处理,C++对象生命周期管理,json解析处理、路径、日期时间以及日志服务等。建议从该部分代码开始学习分析Chrome。因为通过此处的代码的分析,对理解chrome的基础架构设计将会有很大帮助。
breakpad:辅助库,用于崩溃服务框架。当Chrome因为一场而崩溃(Crash)时,捕获异常,并将崩溃现场数据发送给google进行分析。
build:编译构建相关的工具支持库,其中包括了Google自己的URL解析库。
chrome:浏览器主程序模块实现代码,使核心代码,将是后续代码分析的重点之一。Chrome目录包括了UI实现和Render部分两大部分。其中重要工程是:Browser、Renderer和Plugin等。其中Renderer部分是对webkit的封装。该目录中代码数量巨大,Google自己的代码,后续改动频繁的代码大部分集中在这里。
chrome_frame:该目录下是google针对IE开发的一个插件代码,使得IE可以使用chrome的Renderer渲染引擎来显示网页。
content:与浏览器页面处理相关的部分。在早期的Chrome版本中,content内容包含在chrome目录中。在新的版本中,Google将浏览器页面处理部分从chrome模块摘出来,单独形成一个工程目录。
courgette:辅助库,昵称:小胡瓜。该目录包含一个用于生成浏览器升级二进制包的工具。该工具的目的是减少升级过程中数据下载的大小。例如,升级需要替换一个比较大的DLL文件,假设该文件大小超过5M,而新版本可能只是添加了一行代码,变化很小。在Chrome在升级时,通过courgette这个小工具比较新旧两个DLL,找到差异部分,并提取差异部分生成升级包下在到本地进行升级,这样下载的升级包可能只有几十K甚至几K。这将大大缩短用户的升级时间,对于网速慢的用户来说无疑是巨大的福音。
gpu:GPU加速模块,利用GPU渲染页面,提高浏览器性能。
ipc:该目录里是Chrome的核心库之一:进程通信基础设施库。chrome浏览器采用多进程架构,进程间的通信基于IPC。
jingle:该目录是XMPP(The
media:该目录包含多媒体音频和视频解码相关的模块。
native_client:该目录是在浏览器中运行native代码的模块。Native
net:该目录是具体的网络协议实现基础库,其中包括ftp、http等客户端协议栈的实现代码。
ppapi:该目录是一个浏览器插件(Plugin)API模块,全称为Pepper
printing:该目录包含打印模块,实现页面的打印以及打印预览。
remoteing:该目录包含通过终端服务运行应用程序的模块,就是大家听说过的Chromoting这个东东。该功能可以在Chrome/Chrome
rlz:该目录非常特殊,因为它是chrome项目中唯一不提供源代码的不过分。该模块主要用于用户行为追踪就是将用户行为收集报告给google。该模块虽然这对Chrome产品的改善计划提供了很大帮助,但其内在的用户隐私也存在安全问题,因为Google会怎么收集数据、收集什么数据、数据流向都是一个秘密,:D。
sandbox:该目录包含沙盒安全技术模块。该技术用于在浏览网页的时候,保护计算机不被恶意代码侵入。简单说就是虚拟出一个内存空间,将浏览Web时插件对系统功能的调用放到这个虚拟空间中进行,如果发现调用非法,则立刻回卷这部分内容,确保用户系统关键数据不会被恶意应用程序或者病毒修改。该技术伴随windows2000操作系统出现。沙箱是相对安全的,但不是绝对安全,因为已经有攻击成功案例。
skia:该模块是google收购的SKIA公司提供的2D图形渲染引擎库。通常图形渲染库的优劣决定了浏览器的显示效果。
sql:该目录是包含Chrome数据库方面的模块。Chrome采用了SQLITE3数据库引擎。在该模块中包含了对SQLITE3的封装以及对SQL语句的封装和处理。
testing:c++单元测试框架库。
third_party:该目录下是第三方开源支持库,包含了Chrome项目中所有第三方的开源库,其中最重要的是webkit内核。
tools:该目录包含Chrome项目所使用的工具模块,比如堆栈调用、内存监测钩子等等。
ui:该目录是Chrome的界面库。
v8:该目录是Javascript引擎,库,也是chrome的重要内核库。
views:该目录是Chrome的界面控件元素库,针对不同OS平台进行了统一封装,其绘制采用skia引擎实现。Views包括UI事件交互机制、各种控件(如按钮、菜单、树、选择框等等)。
webkit:该目录并不是Webkit,而是Chrome项目对webkit内核的一个封装层。封装的目的是在上层应用调用和webkit内核之间提供一个中间接口层,使Webkit内核功能透明,方便其上层的应用开发。在该目录下的support中有一个名字叫glue的工程。