02数据结构与算法复杂度分析上

数据结构与算法之美专栏笔记

1. 为什么要学习数据结构和算法

数据结构和算法本身解决的是“快”和“省”的问题,让代码运行的更快,让代码存储空间更省

2. 为什么要关注执行效率(算法代码执行时间)

执行效率是算法一个非常重要的考量指标,包括时间、空间复杂度分析

2. 时间复杂度分析的方法
  1. 事后统计法
    特点:1.测试结果非常依赖环境; 2.测试结果受数据规模的影响很大。
  2. 大O复杂度表示法
  • 特点:不需要用具体的测试数据来测试,就可以粗略地估计算法的执行效率的方法。
  • 定义:所有代码的执行时间T(n)与每行代码的执行次数n成正比,这个规律可以总结成一个公式:T(n) = O(f(n))大0时间复杂度表示法(渐进时间复杂度、时间复杂度)表示代码执行时间随数据规模增长的变化趋势
3. 时间复杂度分析使用三技巧
  • 下文的所有代码只是为了讲解时间复杂度,其他方面不做关注
  1. 只·关注循环执行次数最多的一段代码
 int cal(int n) 
{
    int sum = 0;
     int i = 1;
     for (; i <= n; ++i) 
    {
           sum = sum + i;
     }
     return sum;
 }
  1. 加法法则:总复杂度等于量级最大的那段代码的复杂度
int cal(int n) {
   int sum_1 = 0;
   int p = 1;
   for (; p < 100; ++p) {
     sum_1 = sum_1 + p;
   }
   //O(1)
   int sum_2 = 0;
   int q = 1;
   for (; q < n; ++q) {
     sum_2 = sum_2 + q;
   }
   //O(n)
   int sum_3 = 0;
   int i = 1;
   int j = 1;
   for (; i <= n; ++i) {
     j = 1; 
     for (; j <= n; ++j) {
       sum_3 = sum_3 +  i * j;
     }
   }
   //O(n^2)
   return sum_1 + sum_2 + sum_3;
 }
复杂度O(n^2)

如果T1(n) = O(f(n)), T2(n) = O(g(n)),那么T(n) = T1(n) + T2(n) = max(O(f(n)), O(g(n))) = O(max(f(n), g(n)))

  1. 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
int cal(int n) {
   int ret = 0; 
   int i = 1;
   for (; i < n; ++i) {
     ret = ret + f(i);
   } 
 } 
 
 int f(int n) {
  int sum = 0;
  int i = 1;
  for (; i < n; ++i) {
    sum = sum + i;
  } 
  return sum;
 }
//O(n^2)
4. 几种常见时间复杂度实例分析
image.png
  1. 非多项式量(O(2^n)和O(n!))
  2. 多项式量级
  • O(1)
    是一种常量级时间复杂度表示方法。一般情况下,只要算法中不逊扎起循环语句、递归语句、即时有成千上万的代码,其时间复杂度也是O(1)。
  • O(logn)、O(nlogn)
    对数时间复杂度是重点难点
    举例分析
 i=1;
 while (i <= n)  {
   i = i * 2;
 }

按照时间复杂度分析方法,第三行是循环执行次数最多的,所以只要能计算出这行代码被执行了多少次,就能知道整段代码的时间复杂度。
变量i的值从1开始取,每循环一次就乘以2,。当i大于n时,循环结束。实际上,变量i的取值是高中所学的等比数列。一个一个列下来,是下面的样子:


image.png

代码执行的次数,实际就是x的值。通过2^x=n求解这个问题,x=log2n,这段代码的时间复杂度就是O(log2n)。
同理也可以求出下面这段代码的时间复杂度是O(log3n)

 i=1;
 while (i <= n)  {
   i = i * 3;
 }

我们知道,对数之间是可以互相转换的,log3n 就等于 log32 * log2n,所以O(log3n) = O(C * log2n),其中C = log3^2是一个常量。基于我们前面的一个理论:在采用大O标记复杂度的时候,可以忽略系数,即O(Cf(n)) = o(f(n))。所以O(log2n)就等于O(log3n),因此,在对数阶时间复杂度的表示方法里,我们忽略对数的“底”,统一表示为O(logn)。
如果理解了O(logn),那O(nlogn),我们循环执行n遍,时间复杂度就是O(nlogn),归并排序,快速排序的时间复杂度都是O(nlogn)。

  • O(m+n) O(m*n)
int cal(int m, int n) {
  int sum_1 = 0;
  int i = 1;
  for (; i < m; ++i) {
    sum_1 = sum_1 + i;
  }

  int sum_2 = 0;
  int j = 1;
  for (; j < n; ++j) {
    sum_2 = sum_2 + j;
  }

  return sum_1 + sum_2;
}

m和n表示两个数据规模,我们事先无法评估m和n谁的量大,所以我们在表示复杂度的时候,就不能简单的利用加法法则,省略其中一个,所以,上面代码的时间复杂度就是O(m+n),这种情况,需要将加法规则改为:T1(m) + T2(n) = O(f(m))+O(f(n))

5. 空间复杂度分析

空间复杂度全称是渐进空间复杂度,表示算法的存储空间与数据规模之间的增长关系。
我们常见的空间复杂度就是O(1)、O(n)、O(n2 )。

6. 内容小结

复杂度也叫渐进复杂度,包括时间复杂度和空间复杂度,用来分析算法执行效率与数据规模之间的增长关系,可以粗略地表示,越高阶复杂度的算法,执行效率越低。常见的复杂度并不多,从低阶到高阶有:O(1)、O(logn)、O(n)、O(nlogn)、O(n2 )。


image.png

复杂度分析并不难,关键在于多练。让分析算法复杂度成为一种习惯,一种本能。对自己写过的每一句代码负责,尽力写完最优。细节决定成败。

你可能感兴趣的:(02数据结构与算法复杂度分析上)