数据结构笔记-算法时间复杂度分析

 定义:如果一个问题的规模是n,解这一问题的某一算法所需要的时间为T(n),它是n的某一函数 T(n)称为这一算法的“时间复杂性”。

     求解算法的时间复杂度的具体步骤是:

[1] 找出算法中的基本语句:算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。

[2] 计算基本语句的执行次数的数量级:这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可,可以忽略所有低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:增长率。

[3] 用大Ο记号表示算法的时间性能。

     如果算法中包含嵌套的循环,则基本语句通常是最内层的循环体,如果算法中包含并列的循环,则将并列循环的时间复杂度相加。例如:

  for (i=1; i<=n; i++)
       x++;

    for (i=1; i<=n; i++)
       for (j=1; j<=n; j++)
           x++;

  第一个for循环的时间复杂度为Ο(n),第二个for循环的时间复杂度为Ο(n^2),则整个算法的时间复杂度为Ο(n+n^2)=Ο(n^2)。

      二分检索是 O(logn),也就是说它需要“通过logn量级的步骤去检索一个规模为n的数组”记法 O ( f(n) )表示当 n增大时,运行时间至多将以正比于 f(n)的速度增长。

  常见的算法时间复杂度由小到大依次为:

  Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)<…<Ο(2n)<Ο(n!)

Ο(1)表示基本语句的执行次数是一个常数,一般来说,只要算法中不存在循环语句,其时间复杂度就是Ο(1)。Ο(log2n)、Ο(n)、Ο(nlog2n)、Ο(n2)和Ο(n3)称为多项式时间,而Ο(2n)和Ο(n!)称为指数时间。计算机科学家普遍认为前者是有效算法,把这类问题称为P类问题,而把后者称为NP问题。

O(1): Temp=i;i=j;j=temp;                    

 以上三条单个语句的频度为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间复杂度为常数阶,记作T(n)=O(1)。如果算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。此类算法的时间复杂度是O(1)。

O(n^2)

    交换i和j的内容

    sum=0;                (一次)

    for(i=1;i<=n;i++)      (n次 )

       for(j=1;j<=n;j++) (n^2次 )

         sum++;       (n^2次 )

解:T(n)=2n^2+n+1 =O(n^2)

   for (i=1;i

   { 

       y=y+1;        ①   

       for (j=0;j<=(2*n);j++)    

          x++;        ②      

   }         

解:  语句1的频度是n-1

         语句2的频度是(n-1)*(2n+1)=2n^2-n-1

         f(n)=2n^2-n-1+(n-1)=2n^2-2

         该程序的时间复杂度T(n)=O(n^2).         

O(n)                                        

   a=0;

   b=1;                     ①

   for (i=1;i<=n;i++) ②

   {  

      s=a+b;    ③

      b=a;     ④  

      a=s;     ⑤

   }

解:  语句1的频度:2,        

          语句2的频度: n,        

         语句3的频度: n-1,        

         语句4的频度:n-1,    

         语句5的频度:n-1,                                  

         T(n)=2+n+3(n-1)=4n-1=O(n).

                                                                                                 

O(log2n )

   i=1;       ①

   while (i<=n)

      i=i*2; ②

解: 语句1的频度是1,  

         设语句2的频度是f(n),  则:2^f(n)<=n;f(n)<=log2n    

         取最大值f(n)= log2n,

         T(n)=O(log2n )

 

 O(n^3)

   for(i=0;i

   {  

      for(j=0;j

      {

         for(k=0;k

            x=x+2;  

      }

   }

解:当i=m, j=k的时候,内层循环的次数为k当i=m时, j 可以取 0,1,...,m-1 ,  所以这里最内循环共进行了0+1+...+m-1=(m-1)m/2次所以,i从0取到n, 则循环共进行了: 0+(1-1)*1/2+...+(n-1)n/2=n(n+1)(n-1)/6所以时间复杂度为O(n^3).

我们还应该区分算法的最坏情况的行为和期望行为。如快速排序的最坏情况运行时间是 O(n^2),但期望时间是 O(nlogn)。通过每次都仔细地选择基准值,我们有可能把平方情况 (即O(n^2)情况)的概率减小到几乎等于 0。在实际中,精心实现的快速排序一般都能以 (O(nlogn)时间运行。

下面是一些常用的记法:

访问数组中的元素是常数时间操作,或说O(1)操作。一个算法如果能在每个步骤去掉一半数据元素,如二分检索,通常它就取 O(logn)时间。用strcmp比较两个具有n个字符的串需要O(n)时间。常规的矩阵乘算法是O(n^3),因为算出每个元素都需要将n对元素相乘并加到一起,所有元素的个数是n^2。

指数时间算法通常来源于需要求出所有可能结果。例如,n个元素的集合共有2n个子集,所以要求出所有子集的算法将是O(2n)的.指数算法一般说来是太复杂了,除非n的值非常小,因为,在这个问题中增加一个元素就导致运行时间加倍。不幸的是,确实有许多问题 (如著名 的“巡回售货员问题” ),到目前为止找到的算法都是指数的。如果我们真的遇到这种情况, 通常应该用寻找近似最佳结果的算法替代之。

你可能感兴趣的:(数据结构)