二、最好最坏平均时间复杂度

上节说的是算法的时间复杂度是静态的,即算法的复杂度是不会变化的,在任何情况下算法复杂度都是如此,现实情况是算法的复杂度跟数据还有很大的关系,同一个算法,不同的数据,算法复杂度不一样,本节就是为了说明这种动态的算法复杂度。

1、最好最好平均时间复杂度

上一段代码:

// n 表示数组 array 的长度
int find(int[] array, int n, int x) {
  int i = 0;
  int pos = -1;
  for (; i < n; ++i) {
    if (array[i] == x) pos = i;
  }
  return pos;
}

很简单,从数组中查找数据x,时间复杂度为n,但是可以简化,简化后的代码如下:

// n 表示数组 array 的长度
int find(int[] array, int n, int x) {
  int i = 0;
  int pos = -1;
  for (; i < n; ++i) {
    if (array[i] == x) {
       pos = i;
       break;
    }
  }
  return pos;
}

这段代码的时间复杂度就是动态变化的,如果x位于数组第一位,那么时间复杂度为O(1),如果为最后一个,那么时间复杂度为O(n).
所以引入了三个概念:

  • 最好时间复杂度: 在数据最理想情况下,算法的时间复杂度,上面代码为O(1)。
  • 最坏时间复杂度: 在数据最坏情况下,算法时间复杂度,上面代码为O(n).
  • 平均时间复杂度: 数据在上述状况下的概率并不高,为表示平均情况下的时间复杂度,引入了平均时间复杂度的概念。

还是以上述在数组中查找元素x为例,数据x在数组中为0-n-1 一共n个位置,但是如果不在数组中,也同样需要查找n次。
我们算下平均查找次数:


计算过程

按照第一个式子得到的平均时间复杂度为O(n)

注意
第一个式子是有问题的,这里面没有考虑每种情况的概率。首先数据要么在数组中,要么不在数组中,概率为1/2,数据在数组中位置的概率为1/2* 1/n 为1/2n
根据概率算下时间复杂度,即图中的式子二。
这个值为期望值、这个算出来的平均时间复杂度也叫加权时间复杂度或期望时间复杂度。

我以为这就完了,并没有。

2、均摊时间复杂度。

看个例子:

 // array 表示一个长度为 n 的数组
 // 代码中的 array.length 就等于 n
 int[] array = new int[n];
 int count = 0;
 
 void insert(int val) {
    if (count == array.length) {
       int sum = 0;
       for (int i = 0; i < array.length; ++i) {
          sum = sum + array[i];
       }
       array[0] = sum;
       count = 1;
    }

    array[count] = val;
    ++count;
 }

代码通过数组长度判断是否求和,如果还没达到数组长度,将数据放入数组,如果达到了数组长度,则求和,将和放在数组的第一个元素位置。
最好时间复杂度:O(1) 数组中有空位置
最坏时间复杂度: O(n) 数组中已经没有位置了,需要求和。
平均时间复杂度: n个数组位置为n,还有一种情况是数组满了,每种概率为1/(n+1)
算下:
1* 1/(n+1) +1*1/(n+1) ...+n/n+1 = n/(n+1)+ n/(n+1) 约为O(1)。

这段代码比较特殊,n-1次O(1)之后必然来一次O(n)的复杂度,如果我们把这n次耗时均摊到每一次上,那么整个算法的平均复杂度直观来说就是O(1).

对于一组数据结构进行连续操作,大部分情况下时间复杂度都很低,个别情况时间复杂度比较高,而且这些操作具有前后连贯的时间关系,我们将一组操作放在一起分析,看看是否可以把复杂度高的耗时,均分到时间度低的耗时上面,简化计算平均时间复杂度的方法。

你可能感兴趣的:(二、最好最坏平均时间复杂度)