数据结构与算法之美专栏笔记
1. 为什么要学习数据结构和算法
数据结构和算法本身解决的是“快”和“省”的问题,让代码运行的更快,让代码存储空间更省
2. 为什么要关注执行效率(算法代码执行时间)
执行效率是算法一个非常重要的考量指标,包括时间、空间复杂度分析
2. 时间复杂度分析的方法
- 事后统计法
特点:1.测试结果非常依赖环境; 2.测试结果受数据规模的影响很大。 - 大O复杂度表示法
- 特点:不需要用具体的测试数据来测试,就可以粗略地估计算法的执行效率的方法。
- 定义:所有代码的执行时间T(n)与每行代码的执行次数n成正比,这个规律可以总结成一个公式:T(n) = O(f(n))。大0时间复杂度表示法(渐进时间复杂度、时间复杂度)表示代码执行时间随数据规模增长的变化趋势。
3. 时间复杂度分析使用三技巧
- 下文的所有代码只是为了讲解时间复杂度,其他方面不做关注
- 只·关注循环执行次数最多的一段代码
int cal(int n)
{
int sum = 0;
int i = 1;
for (; i <= n; ++i)
{
sum = sum + i;
}
return sum;
}
- 加法法则:总复杂度等于量级最大的那段代码的复杂度
int cal(int n) {
int sum_1 = 0;
int p = 1;
for (; p < 100; ++p) {
sum_1 = sum_1 + p;
}
//O(1)
int sum_2 = 0;
int q = 1;
for (; q < n; ++q) {
sum_2 = sum_2 + q;
}
//O(n)
int sum_3 = 0;
int i = 1;
int j = 1;
for (; i <= n; ++i) {
j = 1;
for (; j <= n; ++j) {
sum_3 = sum_3 + i * j;
}
}
//O(n^2)
return sum_1 + sum_2 + sum_3;
}
复杂度O(n^2)
如果T1(n) = O(f(n)), T2(n) = O(g(n)),那么T(n) = T1(n) + T2(n) = max(O(f(n)), O(g(n))) = O(max(f(n), g(n)))
- 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
int cal(int n) {
int ret = 0;
int i = 1;
for (; i < n; ++i) {
ret = ret + f(i);
}
}
int f(int n) {
int sum = 0;
int i = 1;
for (; i < n; ++i) {
sum = sum + i;
}
return sum;
}
//O(n^2)
4. 几种常见时间复杂度实例分析
- 非多项式量(O(2^n)和O(n!))
- 多项式量级
- O(1)
是一种常量级时间复杂度表示方法。一般情况下,只要算法中不逊扎起循环语句、递归语句、即时有成千上万的代码,其时间复杂度也是O(1)。 - O(logn)、O(nlogn)
对数时间复杂度是重点难点
举例分析
i=1;
while (i <= n) {
i = i * 2;
}
按照时间复杂度分析方法,第三行是循环执行次数最多的,所以只要能计算出这行代码被执行了多少次,就能知道整段代码的时间复杂度。
变量i的值从1开始取,每循环一次就乘以2,。当i大于n时,循环结束。实际上,变量i的取值是高中所学的等比数列。一个一个列下来,是下面的样子:
代码执行的次数,实际就是x的值。通过2^x=n求解这个问题,x=log2n,这段代码的时间复杂度就是O(log2n)。
同理也可以求出下面这段代码的时间复杂度是O(log3n)
i=1;
while (i <= n) {
i = i * 3;
}
我们知道,对数之间是可以互相转换的,log3n 就等于 log32 * log2n,所以O(log3n) = O(C * log2n),其中C = log3^2是一个常量。基于我们前面的一个理论:在采用大O标记复杂度的时候,可以忽略系数,即O(Cf(n)) = o(f(n))。所以O(log2n)就等于O(log3n),因此,在对数阶时间复杂度的表示方法里,我们忽略对数的“底”,统一表示为O(logn)。
如果理解了O(logn),那O(nlogn),我们循环执行n遍,时间复杂度就是O(nlogn),归并排序,快速排序的时间复杂度都是O(nlogn)。
- O(m+n) O(m*n)
int cal(int m, int n) {
int sum_1 = 0;
int i = 1;
for (; i < m; ++i) {
sum_1 = sum_1 + i;
}
int sum_2 = 0;
int j = 1;
for (; j < n; ++j) {
sum_2 = sum_2 + j;
}
return sum_1 + sum_2;
}
m和n表示两个数据规模,我们事先无法评估m和n谁的量大,所以我们在表示复杂度的时候,就不能简单的利用加法法则,省略其中一个,所以,上面代码的时间复杂度就是O(m+n),这种情况,需要将加法规则改为:T1(m) + T2(n) = O(f(m))+O(f(n))
5. 空间复杂度分析
空间复杂度全称是渐进空间复杂度,表示算法的存储空间与数据规模之间的增长关系。
我们常见的空间复杂度就是O(1)、O(n)、O(n2 )。
6. 内容小结
复杂度也叫渐进复杂度,包括时间复杂度和空间复杂度,用来分析算法执行效率与数据规模之间的增长关系,可以粗略地表示,越高阶复杂度的算法,执行效率越低。常见的复杂度并不多,从低阶到高阶有:O(1)、O(logn)、O(n)、O(nlogn)、O(n2 )。
复杂度分析并不难,关键在于多练。让分析算法复杂度成为一种习惯,一种本能。对自己写过的每一句代码负责,尽力写完最优。细节决定成败。