极客算法01 | 复杂度分析

1.数据结构和算法概念

  1. 从广义上讲,数据结构就是指一组数据的存储结构。算法就是操作数据的一组方法。
  2. 数据结构和算法是相辅相成的,数据结构是为算法服务,算法要作用在特定的数据结构之上,二者不能孤立。
  3. 比如,因为数组具有随机访问的特点,常用的二分查找算法需要用数组来存储数据。但如果我们选择链表这种数据结构,二分查找算法就无法工作了,因为链表并不支持随机访问。
  4. 数据结构是静态的,只是组织数据的一种方式,如果不在它的基础之上操作、构建算法,孤立存在的数据结构就是没用的。

2.复杂度分析(上)

一、什么是复杂度分析?

  1. 数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。
  2. 因此需从执行时间占用空间两个维度来评估数据结构和算法的性能。
  3. 分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。
  4. 复杂度描述的是算法执行时间(或占用空间)与数据规模的增长关系。

二、为什么要进行复杂度分析?

  1. 和性能测试相比,复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
  2. 掌握复杂度分析,将能编写出性能更优的代码,有利于降低系统开发和维护成本。
  3. 我们需要一个不用具体的测试数据来测试,就可以粗略地估计算法的执行效率的方法

三、如何进行复杂度分析?
1.大O表示法

  • 来源:算法的执行时间与每行代码的执行次数成正比,用T(n) = O(f(n))表示,其中T(n)表示算法执行总时间,f(n)表示每行代码执行总次数,而n往往表示数据的规模。
  • 特点:以时间复杂度为例,由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势,所以常量阶、低阶以及系数实际上对这种增长趋势不产决定性影响,所以在做时间复杂度分析时忽略这些项。

2.复杂度分析法则

  • 单段代码看高频:比如循环。
  • 多段代码取最大:比如一段代码中有单循环和多重循环,那么取多重循环的复杂度。
  • 嵌套代码求乘积:比如递归、多重循环等
  • 多个规模求加法:比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。

四、常用的复杂度级别?

  • 多项式阶:随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。包括O(1)(常数阶)、O(logn)(对数阶)、O(n)(线性阶)、O(nlogn)(线性对数阶)、O(n^2)(平方阶)、O(n^3)(立方阶)
  • 非多项式阶:随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括O(2^n)(指数阶)、O(n!)(阶乘阶)

3.复杂度分析(下)

一、复杂度分析的4个概念

  1. 最坏情况时间复杂度:代码在最理想情况下执行的时间复杂度。
  2. 最好情况时间复杂度:代码在最坏情况下执行的时间复杂度。
  3. 平均时间复杂度:用代码在所有情况下执行的次数的加权平均值表示。
  4. 均摊时间复杂度:在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。

二、为什么要引入这4个概念?

  1. 同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这4个概念。
  2. 代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析它们的。

三、如何分析平均、均摊时间复杂度?

  1. 平均时间复杂度:代码在不同情况下复杂度出现量级差别,则用代码所有可能情况下执行次数的加权平均值表示。
  2. 均摊时间复杂度:两个条件满足时使用

        代码在绝大多数情况下是低级别复杂度,只有极少数情况是高级别复杂度。

        低级别和高级别复杂度出现具有时序规律,均摊结果一般都等于低级别复杂度。

你可能感兴趣的:(数据结构与算法)