Apache HTTP 服务器 是 一个模块化(或说积木式)的程序,管理员可以选择一些模块来增加服务器的某些功能。这些模块,可以在创建服务器程序时静态地编译到httpd服务器的二进 制代码中,也可以编译成一些独立于服务器程序的Dynamic Shared Objects (DSOs)文件。DSO 文件可以在编译服务器程序时创建,也可以在以后利用Apache扩展工具apxs 来单独创建。
这篇文档,将描述如何使用DSO 模块,以及其背后的原理。
Apache HTTPD对DSO 的支持,即对单个模块的动态加载,是基于一个叫mod_so 的模块来实现的,此时mod_so必须被静态地编译到HTTP服务器内核中。这是除了core以外唯一不能以dso方式编译的模块。实际操作时,其它的Apache模块可以在编译服务器程序时通过单独指定来将其编译为DSO文件,正如安装文档 中讲述的,此时configure的设置参数应为--enable-xxxx=shared(xxxx为模块的名字,如rewrite等)。 当一个模块被编译为一个名为mod_foo.so的DSO文件后,就可以在httpd.conf文件中用mod_so的LoadModule 命令,告诉服务器在启动或重新启动时将此模块加载。
为了简化创建Apache模块(尤其是第三方模块)的DSO文件的过程,apache提供了一个新工具名叫apxs(APache eXtenSion)。它可以脱离apache的源码将模块编译成DSO文件。它的实现思路非常简单: 在安装Apache时,configure脚本的 make install 过程会安装Apache的C头文件,并在apxs程序(apxs是一个perl脚本)中对依赖于具体平台的编译器和连接器设置一些标志(Flag),以供 创建DSO文件。通过这种方式,用户就可以利用apxs在没有Apache源码树且无需针对当前平台的编译器和连接器进行配置(以生成DSO格式目标文 件)的情况下编译Apache模块了。
在所有的情况下,当一个模块编译完成后,必须在httpd.conf使用LoadModule命令在告诉 Apache激活这个模块.
在现代的Unix的派生版本中,有一种非常好的机制,叫做Dynamic Shared Objects (DSO) 的动态连接/和加载,它提供了一种方法,将一段代码编译成一种特殊格式后可在一个可执行程序运行时将这段程序加载到它的地址空间中。
这种加载通过可以通过两种方式做到: 在一个可执行程序开始运行后通过一个叫ld.so的系统程序自动加载,或在可执行程序内部通过Unix加载器(loader)的系统编程接口的系统调用dlopen()/dlsym()来手工加载。
在第一种方式中,DSO通常被叫作共享库或DSO库,以libfoo.so或libfoo.so.1.2的形式命名。它们被存放在系统目录中 (通常是/usr/lib),它们与可执行程序的联系是在编译这个可执行程序时,通过传递给连接器一个-lfoo参数来建立的。这里对库的引用直接编码在 可执行程序中,因而在程序运行时,Unix加载器会通过以下途径寻找libfoo.so:在系统目录/usr/lib下,在通过-R连接参数传递给连接器 后被编码在可执行程序中的路径中,在通过环境变量LD_LIBRARY_PATH指定的目录中。加载器会解析出来那些在可执行程序中使用但是在DSO定义 的标志(symbol)。
可执行程序中的标志,通常不会被DSO引用(因为它是一个可重用的基本代码库),因而就不再进行进一步的解析。可执行程序自己不需要做任何事情 就可以使用来自DSO的标志,因为Unix加载器已经做了相关的解析工作。(实际上,加载ld.so的代码是使用动态库的可执行程序启动代码的一部分). 动态加载基本代码库的优点是很明显的:库的代码只需在一个系统库(如libc.so)中保存一次,这样可以节省每个程序的磁盘空间。
在第二种方式中,DSO通常被叫作共享对象或DSO文件,命名它们时可以使用任意的扩展名,虽然规范的命名是foo.so的样子。这些文件通常 存放在程序所在的目录(或子目录)中,它们与执行它们的程序没有自动建立的联系。相反,可执行程序在运行时通过dlopen手工将DSO加载。此时,来自 DSO供执行程序用的标志没有被解析。相反,Unix加载器自动解析所有DSO中使用的来自可执行程序和它已经加载的DSO 库的标志(尤其是来自无处不在的libc.so的所有标志)。在这种方式中,DSO取得可执行程序的标志集合的信息,就象是被静态地连接到可执行程序中一 样。
最后,为利用DSO's API,可执行程序须通过dlsym()来解析来自DSO的特定标志,供在以后的分派表等处使用。也就是说:可执行程序要想使用来自DSO的标志,须手工 解析它。这样一种机制的优点,不需要的程序段不必加载(因而可以节省内存的使用) ,直到我们讨论的程序需要它时。当需要时,这些程序段可以被动态的加载,来扩展基本程序的功能。
虽然DSO机制听起来简单,用起来只少有一个比较困难的步骤,就是当用DSO来扩展程序的功能时(第二种方式)时,对来自可执行程序、供DSO 使用的标志的解析。为什么呢? 因为"反向解析" DSO 使用的来自可执行程序标志集合的标志是与函数库的设计相逆的 (函数库没有任何关于那些使用它的程序的信息),而且没有平台提供这种功能,这也不是一个标准化的功能。实际上,可执行程序的全局标志常常不能再次输出, 因而也无法供DSO使用。要利用DSO来动态扩展一个程序的功能,找到一种方法来强制连接器输出所有全局标志是必须解决的主要问题。
共享库的方法就是一个典型,因为它是DSO机制最初设计的目标,因而它被用于操作系统提供的几乎所有类型的函数库中。从另一方面来说,利用共享对象来扩展功能的程序并不是很多。
到1998年,只有很少的软件包在程序运行时利用DSO机制来扩展它们的功能:Perl 5(通过它的XS机制和DynaLoader模块), Netscape Server,等。从版本1.3开始, Apache 也加入了这个群体,因为Apache早就用模块的概念来扩展它的功能,且在内容利用基于分派链(dispatch-list-based )的方法来将外部的模块连接到Apache的核心功能中。因此,Apache实际上注定要用DSO来在运行时加载模块的。
上述的基于DSO的功能有以下优点:
DSO 也有下列不足::