PHP程序加速探索
Haohappy 2004-07-27
[email protected]
- (一)简介
- (二)是否需要加速?
- (三)如何加速?
-<1> 测试
◆ 服务器负载测试 ApacheBench
◆ 脚本执行速度测试 PEAR:: Benchmark
-<2> 加速
◆ 代码优化
◆ 压缩输出 Gzip
◆ 内容缓存输出 PEAR Content cache
◆ 函数缓存输出 PEAR Function cache
◆ 加速工具软件 APC、Turck MMCache、PHPA、Zend Performance Suite
- (四)总结
<1> 测试
◆ 服务器负载测试
服务器负载太大而影响程序效率也是很常见的,我们需要对此进行测试。这里我以目前最常用的Apache服务器为例。
Apache服务器自带有一个叫AB(ApacheBench)的工具,在bin目录下。使用这个轻巧的工具我们可以对服务器进行负载测试,看看在重负荷之下服务器的表现如何。ApacheBench 可以针对某个特定的 URL 仿真出连续的联机请求,同时还可以仿真出同时间点数个相同的联机请求,因此利用 ApacheBench 可帮助我们在网站开发期间仿真实际上线可能的情况,利用仿真出来的数据作为调整服务器设定或程序的依据。
在命令行下输出:
./ab -n number_of_total_requests \
-c number_of_simultaneous_requests \
http://your_web_server/your_php_app.php
例如:
./ab -n 1000 -c 50 http://www.domain.com/myapp.php
AB将同时向http://www.domain.com/myapp.php发出50个并发请求,共发出1000次。
测试结果将可能是这样的:
Server Software: Apache/2.0.16
Server Hostname: localhost
Server Port: 80
Document Path: /myapp.php
Document Length: 1311 bytes
Concurrency Level: 50
Time taken for tests: 8.794 seconds
Complete requests: 1000
Failed requests: 0
Total transferred: 1754000 bytes
HTML transferred: 1311000 bytes
Requests per second: 113.71
Transfer rate: 199.45 kb/s received
Connection Times (ms)
min avg max
Connect: 0 0 5
Processing: 111 427 550
Total: 111 427 555
myapp.php每秒钟可以处理的请求数为113.71个。将请求数增加,看看服务器能否处理更大的压力。你也需要调节Apache的MaxClients,ThreadsPerChild,MaxThreadsPerChild等参数,基于你的httpd.conf中的MPM模块选择。
如果你想得到更详细的信息,请到www.apache.org上查阅一些更深入的文档,包括模块和第三方的提高效率的工具。修改httpd.conf后,要重启Apache服务器,然后再用AB测试。你会看到每秒请求数增加或减少。
记下每次的参数,最后选择最佳效率的那种配置。
要指出的是,除了AB,还有许多优秀的服务器性能测试软件。另外,如果你的服务器不是Apache,请自行寻找测试方法。
◆ 脚本执行速度测试
前面有提到,只有找到影响速度的代码,我们才有可能进行优化。PEAR的benchmark包中的Benchmark_Timer类和Benchmark_Iterate类,可以用来很方便地测试脚本执行的速度。(关于PEAR的安装与配置请自行查看相关资料)
首先用Benchmark_Iterate类来测试程序中某个函数或类的某个方法的执行时间。
benchmark1.php
require_once(
'Benchmark/Iterate.php'
);
$benchmark
= new
Benchmark_Iterate()
;
$benchmark
->
run
(
10
,
'myFunction'
,
'test'
);
$result
=
$benchmark
->
get
();
echo
"
;
exit;
function
myFunction
(
$var
) {
// do something
echo
'Hello '
;
}
?>
";
print_r
(
$result
);
echo
"
"
建立benchmark Iterate对象$benchmark,这个对象用来执行myFunction函数10次。
$argument变量每次都传递给myFunction. 多次运行的分析结果存入$result,然后用benchmark对象的get()方法来获取。这个结果用print_r()输出到屏幕。通常会输出这样的结果:
Hello Hello Hello Hello Hello Hello Hello Hello Hello Hello
Array
(
[1] => 0.000427
[2] => 0.000079
[3] => 0.000072
[4] => 0.000071
[5] => 0.000076
[6] => 0.000070
[7] => 0.000073
[8] => 0.000070
[9] => 0.000074
[10] => 0.000072
[mean] => 0.000108
[iterations] => 10
)
myFunction的每次执行,benchmark对象都会跟踪执行时间。并且会计算平均的执行时间([mean]那一行)。通过多次运行目标函数,你可以得到该函数的平均运行时间。
在实际测试中,函数的次数应当至少1000次左右,这样可以得到较客观的结果。
现在我们看看另一个测试脚本运行时间的方法--使用Benchmark_Timer类来测试一段代码执行所消耗的时间及这一段代码中每次调用与下一次调用间的时间。
benchmark2.php
require_once
'Benchmark/Timer.php'
;
$timer
= new
Benchmark_Timer
();
$timer
->
start
();
$timer
->
setMarker
(
'start_myFunction'
);
for(
$i
=
0
;
$i
<
10
;
$i
++){
myFunction
(
$argument
);
}
$timer
->
setMarker
(
'end_myFunction'
);
$timer
->
stop
();
$profiling
=
$timer
->
getProfiling
();
echo
'
.
$timer
->
timeElapsed
(
'start_myFunction'
,
'end_myFunction'
) .
'
Time elapsed: '
';
echo
'
;
exit;
function
myFunction
(
$var
) {
static
$counter
=
0
;
// do something
echo
$counter
++ .
' '
;
}
?>
';
print_r
(
$profiling
);
echo
'
'
首先,建立一个benchmark timer对象$timer。然后调用start()方法,表示开始计时。 SetMaker()方法用来标记要测试的代码段。MyFunction()函数在循环中被调用,表示一段要执行的代码(当然实际中不会这么简单)。然后再用$timer对象的setMarker()方法标记程序执行终点。分析信息用getProfiling()来获取。在两个标记间程序执行消耗的时间用timeElapsed()方法计算出来(就像例子中的循环)。最后,用print_r()输出信息到屏幕:
0 1 2 3 4 5 6 7 8 9
Time elapsed: 0.000594
Array
(
[0] => Array
(
[name] => Start
[time] => 1085730111.27175200
[diff] => -
[total] => 1085730111.271752
)
[1] => Array
(
[name] => start_myFunction
[time] => 1085730111.27203800
[diff] => 0.000286
[total] => 1085730111.272038
)
[2] => Array
(
[name] => end_myFunction
[time] => 1085730111.27263200
[diff] => 0.000594
[total] => 1085730111.272632
)
[3] => Array
(
[name] => Stop
[time] => 1085730111.27271800
[diff] => 0.000086
[total] => 1085730111.272718
)
)
通过这种方法,你可以在代码中设置大量时间段标记,获取每段代码执行时消耗的时间,很容易可以看出到底是哪一部份的代码影响了整个程序的运行效率。然后开始着手对这部份代码进行改进。
用以上两种方法,你可以找出代码中最影响速度的部份代码。另外还可以用来对优化后的代码进行测试,看看到底执行速度提高了多少。通过测试->优化->测试->优化 …这样不断循环,你可以最终确定提供最佳效率的代码。
<2> 加速
◆ 代码优化
掌握了PEAR::BenchMark,现在你已经知道如何测试你的代码,知道如何判断你的代码是快是慢,是哪一部份比较慢。那么接下来我要说的就是如何消灭或优化那部份慢的代码。
这一点上我个人最主要的经验只有两点,一是消除错误的或低效的循环;二是优化数据库查询语句。其实还存在一些其它的优化细节,比如“str_replace比ereg_replace快”、“echo比print快”等等。这些我暂时都放在一边,稍后我会提到用缓存来对付过于频繁的IO。
下面我们将三个功能相同,但程序写法不同的函数的效率(消耗的时间)进行对比。
badloops.php
<?php
require_once(
'Benchmark/Iterate.php'
);
define
(
'MAX_RUN'
,
100
);
$data
= array(
1
,
2
,
3
,
4
,
5
);
doBenchmark
(
'v1'
,
$data
);
doBenchmark
(
'v2'
,
$data
);
doBenchmark
(
'v3'
,
$data
);
function
doBenchmark
(
$functionName
=
null
,
$arr
=
null
)
{
reset
(
$arr
);
$benchmark
= new
Benchmark_Iterate
;
$benchmark
->
run
(
MAX_RUN
,
$functionName
,
$arr
);
$result
=
$benchmark
->
get
();
echo
'<br>'
;
printf
(
"%s ran %d times where average exec time %.5f ms"
,
$functionName
,
$result
[
'iterations'
],
$result
[
'mean'
] *
1000
);
}
function
v1
(
$myArray
=
null
) {
//
效率很差的循环
for (
$i
=
0
;
$i
<
sizeof
(
$myArray
);
$i
++)
{
echo
'<!--'
.
$myArray
[
$i
] .
' --> '
;
}
}
function
v2
(
$myArray
=
null
) {
//
效率略有提高
$max
=
sizeof
(
$myArray
);
for (
$i
=
0
;
$i
<
$max
;
$i
++)
{
echo
'<!--'
.
$myArray
[
$i
] .
' --> '
;
}
}
function
v3
(
$myArray
=
null
){
//
最佳效率
echo
"<!--"
,
implode
(
" --> <!--"
,
$myArray
),
" --> "
;
}
?>
程序输出的结果大概是这样的:
v1 ran 100 times where average exec time 0.18400 ms
v2 ran 100 times where average exec time 0.15500 ms
v3 ran 100 times where average exec time 0.09100 ms
可以看到,函数的执行时间变少,效率上升。
函数v1有个很明显的错误,每一次循环的时间,都需要调用sizeof()函数来计算。函数v2则在循环外把$myArray数组的元素个数存到$max变量中,避免了每次循环都要计算数组的元素个数,所以效率提高了。函数v3的效率最高,利用了现成的函数,避免循环。
这个例子只是给你一个感性的认识,明白什么是相对高效的代码。在实际开发中,我相信会有很多人会迷迷糊糊地写出很多低效率的代码。要把代码写得精炼而高效,恐怕需要时间去锤炼:-)但这是另一个话题了,我们略过不谈。
数据库应用基本上每个PHP程序都会用到,在实际开发中我发现最影响整个系统效率的就是数据库这部份。至于数据库的优化和数据查询语句的优化,在此限于篇幅不详细讨论。你可以参看这两篇文章:
http://www.phpe.net/articles/340.shtml
http://www.phpe.net/articles/323.shtml
及这篇讨论:
http://club.phpe.net/index.php?s=&act=ST&f=15&t=4783&st=0
(前面几篇贴子总结不错)
主要是针对MySQL的。
◆压缩输出 gzip
利用Apache中的mod_gzip模块,我们可以利用gzip的压缩算法来对Apache服务器发布的网页内容进行压缩后再传输到客户端的浏览器。如果是纯文本的内容,效果非常明显,大约可以压缩到原来的30%-40%,使用户的浏览速度大大加快。
Gzip需要客户端浏览器支持,目前大部份浏览器都支持gzip,如IE,Netscape,Mozilla等,所以这种方法值得一试。我们可以利用PHP中的预定义变量$_SERVER[‘HTTP_ACCEPT_ENCODING’]来判断客户端浏览器是否支持gzip。
gzip1.php</