一、prefork
prefork采用预派生子进程方式,用单独的子进程来处理不同的请求。进程之间彼此独立,每个进程只含有一个线程。在"conf/extra/httpd-mpm.conf”中是如下定义的:
<IfModule mpm_prefork_module> StartServers 5 MinSpareServers 5 MaxSpareServers 10 MaxClients 150 MaxRequestsPerChild 0 </IfModule>
prefork控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足MinSpareServers设置的值为止。这种模式可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。MaxSpareServers设置了最大的空闲进程数,如果空闲进程数大于这个值,Apache会自动kill掉一些多余进程。这个值不要设得过大,但如果设的值比MinSpareServers小,Apache会自动把其调整为 MinSpareServers+1。如果站点负载较大,可考虑同时加大MinSpareServers和MaxSpareServers。 MaxRequestsPerChild设置的是每个子进程可处理的请求数。每个子进程在处理了“MaxRequestsPerChild”个请求后将自动销毁。0意味着无限,即子进程永不销毁。虽然缺省设为0可以使每个子进程处理更多的请求,但如果设置成非零值也有两点重要的好处:1、可防止意外的内存泄漏。2、在服务器负载下降时会自动减少子进程数。因此,可根据服务器的负载来调整这个值。MaxClients是这些指令中最为重要的一个,设定的是 Apache可以同时处理的请求,是对Apache性能影响最大的参数。其缺省值150是远远不够的,如果请求总数已达到这个值(可通过ps -ef|grephttp|wc -l来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源还剩下很多而HTTP访问却很慢的主要原因。虽然理论上这个值越大,可以处理的请求就越多,但Apache默认的限制不能大于256。ServerLimit指令无需重编译Apache就可以加大MaxClients。测试数据:
二、Worker
相对于prefork,worker全新的支持多线程和多进程混合模型的MPM。由于使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器。但是,worker也使用了多进程,每个进程又生成多个线程,以获得基于进程服务器的稳定性。在configure–with-mpm=worker后,进行make编译、make install安装。在缺省生成的httpd-mpm.conf中有以下默认配置段:
<IfModule mpm_worker_module> StartServers 2 MaxClients 150 MinSpareThreads 25 MaxSpareThreads 75 ThreadsPerChild 25 MaxRequestsPerChild 0 </IfModule>
Worker由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的ThreadsPerChild线程数,各个线程独立地处理请求。同样,为了不在请求到来时再生成线程,MinSpareThreads和MaxSpareThreads设置了最少和最多的空闲线程数;而MaxClients 设置了同时连入的clients最大总数。如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程。MinSpareThreads和 MaxSpareThreads的最大缺省值分别是75和250。这两个参数对Apache的性能影响并不大,可以按照实际情况相应调节。 ThreadsPerChild是worker MPM中与性能相关最密切的指令。ThreadsPerChild的最大缺省值是64,如果负载较大,64也是不够的。这时要使用 ThreadLimit指令,它的最大缺省值是20000。Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild 值决定的,应该大于等于MaxClients。如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时也需要显式声明ServerLimit(最大值是20000)。需要注意的是,如果显式声明了ServerLimit,那么它乘以 ThreadsPerChild的值必须大于等于MaxClients,而且MaxClients必须是ThreadsPerChild的整数倍,否则 Apache将会自动调节到一个相应值。
Prefork和Worker两种模式不同配置的测试数据:
测试环境:Ubuntu 9.04 AMD64 Server 虚拟机
测试工具:Apache ab压力测试工具、top工具
测试数据:Apache静态页面,大小:44B
1、 Prefork模式,选项顺序:ServerLimit,StartServer,MinSpareServers,MaxSpareServers,MaxClients,MaxRequestPerChild
1)、配置1:(-,5,5,10,150,0)
数据总量(次数) |
并发量 |
cpu% |
请求数/秒 |
100000 |
100 |
55.5 |
830.34 |
200 |
56.3 |
674.48 |
|
500 |
58.7 |
762.48 |
|
1000 |
56.5 |
883.00 |
2)、配置2:(10000,5,5,10,500,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
56.8 |
809.20 |
200 |
55.4 |
667.99 |
|
500 |
56.6 |
843.63 |
|
1000 |
53.9 |
706.82 |
3)、配置3:(10000,5,5,10,1000,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
54.8 |
637.39 |
200 |
57.3 |
655.36 |
|
500 |
56.0 |
706.20 |
|
1000 |
54.5 |
803.37 |
4)、配置4:(10000,5,5,10,1500,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
57.4 |
816.91 |
200 |
56.6 |
801.27 |
|
500 |
57.3 |
829.42 |
|
1000 |
56.3 |
696.96 |
2、 Worker模式,选项顺序:
ServerLimt,Threadlimt,Startservers,MaxClients,MinspareThread,MaxspareThread,ThreadperChild,
MaxRequestPerChild
1)、配置1:(50,500,5,10000,50,200,200,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
27.2 |
1964.75 |
200 |
29.6 |
1854.98 |
|
500 |
29.3 |
1836.78 |
|
1000 |
32.0 |
1823.28 |
2)、配置2:(100,500,5,10000,50,200,100,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
25.2 |
2370.93 |
200 |
25.7 |
2374.59 |
|
500 |
28.2 |
2008.13 |
|
1000 |
27.7 |
1921.19 |
3)、配置3:(200,500,5,10000,50,200,50,0)
数据总量(次数) |
并发量(c) |
cpu% |
请求数/秒 |
100000 |
100 |
25.6 |
2305.74 |
200 |
25.7 |
2351.40 |
|
500 |
28.3 |
1944.05 |
|
1000 |
27.2 |
1954.87 |
横向对比:从响应请求和硬件能耗来说,worker模式是由于prefork的。
纵向对比:在worker模式下,配置2比其他配置性能优秀。
总结:在数据总量和并发量相同的条件下,选择worker模式。在worker模式下,进程数和进程内的线程比例关系在1:1左右。该测试数据说明Apache服务器的调优方向,为系统上线提供优化空间。