三种遍历树的方法

树的概念在开发里面是很重要的一部分,xml的文档对象模型(DOM)就是一棵树,文件夹文件的结构也是一棵树。遍历树是开发中经常要遇到的一个问题,比如,要找出DOM里面的img 标签的个数,就要遍历一棵DOM树。要在一个目录里面查找是否有一个文件也要用到遍历这个目录。在这里我们以遍历文件为例,说明遍历树的三种基本的方法:递归深度优先算法,非递归深度优先算法,非递归广度优先算法。     这些算法是我们在项目中经常重复的一些算法,我感觉我写程序以来,我做的大多数算法都用了大二学的那本数据结构,有些时候,只是改装一些一些算法,有些时候也只是把几种算法合并一下,也许这是为什么数据结构这本书这样重要的原因。 先看代码:

  
    
1 define ( ' DS ' , DIRECTORY_SEPARATOR);
2   function rec_list_files( $from = ' . ' ) {
3 if ( ! is_dir ( $from )) {
4 return array ();
5 }
6 $files = array ();
7 if ( $dh = opendir ( $from )) {
8 while ( false !== ( $file = readdir ( $dh ))) {
9 if ( $file == ' . ' || $file == ' .. ' ) {
10 continue ;
11 }
12 $path = $from . DS . $file ;
13 if ( is_file ( $path )) {
14 $files [] = $path ;
15 }
16 $files = array_merge ( $files , rec_list_files( $path ));
17 }
18 closedir ( $dh );
19 }
20 return $files ;
21 }
22
23 function deep_first_list_files( $from = ' . ' ) {
24 if ( ! is_dir ( $from )) {
25 return false ;
26 }
27 $files = array ();
28 $dirs = array ( $from );
29 while ( NULL !== ( $dir = array_pop ( $dirs ))) {
30 if ( $dh = opendir ( $dir )) {
31 while ( false !== ( $file = readdir ( $dh ))) {
32 if ( $file == ' . ' || $file == ' .. ' ) {
33 continue ;
34 }
35 $path = $dir . DS . $file ;
36 if ( is_dir ( $path )) {
37 $dirs [] = $path ;
38 } else {
39 $files [] = $path ;
40 }
41 }
42 closedir ( $dh );
43 }
44 }
45 return $files ;
46 }
47
48 function breadth_first_files( $from = ' . ' ) {
49 $queue = array ( rtrim ( $from , DS) . DS); // normalize all paths
50 $files = array ();
51 while ( $base = array_shift ( $queue )) {
52 if (( $handle = opendir ( $base ))) {
53 while (( $child = readdir ( $handle )) !== false ) {
54 if ( $child == ' . ' || $child == ' .. ' ) {
55 continue ;
56 }
57 if ( is_dir ( $base . $child )) {
58 $combined_path = $base . $child . DS;
59 array_push ( $queue , $combined_path );
60 } else {
61 $files [] = $base . $child ;
62 }
63 }
64 closedir ( $handle );
65 } // else unable to open directory => NEXT CHILD
66 }
67 return $files ; // end of tree, file not found
68 }
69
70 function profile( $func , $trydir ) {
71 $mem1 = memory_get_usage();
72 echo ' <pre>----------------------- Test run for ' . $func . ' () ' ;
73 flush ();
74 $time_start = microtime ( true );
75 $list = $func ( $trydir ); // print_r($list);
76 $time = microtime ( true ) - $time_start ;
77 echo ' Finished : ' . count ( $list ) . ' files</pre> ' ;
78 $mem2 = memory_get_peak_usage();
79 printf ( ' <pre>Max memory for ' . $func . ' () : %0.2f kbytes Running time for ' . $func . ' () : %0.f s</pre> ' , ( $mem2 - $mem1 ) / 1024.0 , $time );
80 return $list ;
81 }
82
83 profile( ' rec_list_files ' , " D:\www\server " );
84 profile( ' deep_first_list_files ' , " D:\www\server " );
85 profile( ' breadth_first_files ' , " D:\www\server " );
86
87

rec_list_files 是递归的深度优先的算法,这个是用一个简单的函数递归来实现,用array_merge 来合并数组 deep_first_list_files 是非递归的深度优先的算法,用了一个栈来实现。 breadth_first_files 是非递归的广度优先算法,用了一个队列来实现。顺便说一句,php中的数组,可以做为hashtable,queue,stack,普通数组,甚至做树也是可以的。运行的结果:

-----------------------Test run for rec_list_files() ...Finished : 1868 files

Max memory for rec_list_files() : 496.93 kbytes Running time for rec_list_files() : 9.231678 s-----------------------

Test run for deep_first_list_files() ...Finished : 1868 files

Max memory for deep_first_list_files() : 432.41 kbytes Running time for deep_first_list_files() : 3.940216 s-----------------------

Test run for breadth_first_files() ...Finished : 1868 files

Max memory for breadth_first_files() : 432.55 kbytes Running time for breadth_first_files() : 3.749125 s

第二种和第三种方法的效率和内存消耗差别不大,但是第一种递归调用消耗的内存和时间都要大很多,有时候为了效率,可能采用非递归的实现方式比较的好。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/niniwzw/archive/2008/06/28/2594877.aspx

你可能感兴趣的:(遍历)