本篇所涉及的提问,正文的知识点,全都来自于王争的《数据结构与算法之美》,当然,我并不会全文照搬过来,毕竟这是付费的课程,应该会涉及到侵权之类的问题。
所以,本篇正文中的知识点,是我从课程中将知识点消耗后,用个人的理解、观念所表达出来的文字,参考了原文,但由于是个人理解,因此不保证观点完全正确,也不代表错误的观点是课程所表达的。如果这样仍旧还是侵权了,请告知,会将发表的文章删掉。
1、为什么需要复杂度分析?
传统性能测试缺点:
- 1、非常依赖测试环境
- 2、受数据规模的影响很大
而复杂度描述的是算法执行时间(或者占用空间)与数据规模的增长有关。相对性能测试而言复杂度分析不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
2、大 O 复杂度表示法
n :表示数据规模的大小
T(n):表示代码执行的时间
f(n) :表示每行代码执行的次数总和
O:表示代码的执行时间 T(n) 与 f(n) 表达式成正比
注意:公式中的低阶、常量、系数三部分并不左右增长趋势,所以都可以忽略。我们只需要记录一个最大量级就可以了。
规则:
- 只关注循环执行次数最多的一段代码
- 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
几种常见时间复杂度
1. O(1)
只要代码的执行时间不随 n 的增大而增长,这样代码的时间复杂度的一种表示方法,并不是指只执行了一行代码。
2. O(logn)、O(nlogn)
对数阶时间复杂度非常常见,同时也是最难分析的一种时间复杂度。我通过一个例子来说明一下。
i=1;
while (i <= n) {
i = i * 2;
}
循环n次,变量 i 的取值就是一个等比数列。可以得出
由
对数之间是可以互相转换的, 就等于 *
在对数阶时间复杂度的表示方法里,我们忽略对数的“底”,统一表示为 O(logn)。
如果一段代码的时间复杂度是 O(logn),我们循环执行 n遍,时间复杂度就是 O(nlogn) 了。
O(nlogn) 也是一种非常常见的算法时间复杂度。比如,归并排序、快速排序的时间复杂度都是 O(nlogn)。
3. O(m+n)、O(m*n)
int cal(int m, int n) {
int sum_1 = 0;
int i = 1;
for (; i < m; ++i) {
sum_1 = sum_1 + i;
}
int sum_2 = 0;
int j = 1;
for (; j < n; ++j) {
sum_2 = sum_2 + j;
}
return sum_1 + sum_2;
}
m 和 n 是表示两个数据规模。我们无法事先评估 m 和 n谁的量级大,所以,上面代码的时间复杂度就是 O(m+n)。
1int cal(int m) {
2 int ret = 0;
3 int i = 1;
4 for (; i < m; ++i) {
5 ret = ret + f(i);
6 }
7 }
8
9 int f(int n) {
10 int sum = 0;
11 int i = 1;
12 for (; i < n; ++i) {
13 sum = sum + i;
14 }
15 return sum;
16 }
复杂度就是 O(m*n)。
3、空间复杂度分析
前面讲过,时间复杂度的全称是渐进时间复杂度,表示算法的执行时间与数据规模之间的增长关系。类比一下,空间复杂度全称就是渐进空间复杂度(asymptotic space complexity),表示算法的存储空间与数据规模之间的增长关系。
常见的空间复杂度就是 O(1)、O(n)、O(n2 )
1void print(int n) {
2 int i = 0;
3 int[] a = new int[n];
4 for (i; i = 0; --i) {
8 print out a[i]
9 }
10}
跟时间复杂度分析一样,我们可以看到,第 2 行代码中,我们申申请了一个空间存储变量 i,但是它是常量阶的,跟数据规模 n 没有关系,所以我们可以忽略。第 3 行申请了一个大小为 n 的 int 类型数组,除此之外,剩下的代码都没有占用更多的空间,所以整段代码的空间复杂度就是 O(n)。
4、内容小结
复杂度也叫渐进复杂度,包括时间复杂度和空间复杂度,用来分析算法执行效率与数据规模之间的增长关系,可以粗略地表示,越高阶复杂度的算法,执行效率越低。常见的复杂度并不多,从低阶到高阶有:O(1)、O(logn)、O(n)、O(nlogn)、O(n2 )。