如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:
long long Fib(int N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
下面举个例子:
请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
Func1 执行的基本操作次数 : F(N) = N^2 + 2*N + 10
代入数字计算一下
N = 10 F(N) = 130
N = 100 F(N) = 10210
N = 1000 F(N) = 1002010
可以发现当N越来越大的时候,数字的大小主要取决于N^2了。
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为: O(N^2)
N = 10 F(N) = 100
N = 100 F(N) = 10000
N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
实例1
计算Func2的时间复杂度
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
基本操作执行了2*N + 10次,而通过推导大O阶方法
用常数1取代加法常数,得到2*N + 1
只保留最高阶项,得到2*N
将最高阶项的系数变为1,得到N
所以最后的时间复杂度是O(N)
实例2
计算Func3的时间复杂度
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++k)
{
++count;
}
for (int k = 0; k < N; ++k)
{
++count;
}
printf("%d\n", count);
}
时间复杂度为O(N+M)
实例3
计算Func4的时间复杂度
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++k)
{
++count;
}
printf("%d\n", count);
}
用常数1替代100,时间复杂度是O(1)
实例4
计算strchr的时间复杂度
const char* strchr(const char* str, int character)
{
while (*str != character)
{
str++;
}
return str;
}
最快执行了1次,最慢执行了N次,所以时间复杂度是O(N)
实例5
计算BubbleSort的时间复杂度
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
第一趟冒泡排序了N - 1次,第二趟冒泡排序了N - 2次,依次类推,排序这个基本操作在最坏的情况下一共执行了(N*(N+1)/2次,而最好的情况下是数组已经排好了,此时只需要执行N次,时间复杂度取最坏的情况,所以是O(N^2)
实例6
计算BinarySearch的时间复杂度
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n - 1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end - begin) >> 1);
if (a[mid] < x)
begin = mid + 1;
else if (a[mid] > x)
end = mid - 1;
else
return mid;
}
return -1;
}
假如有序数组有N个数,那么查找一次就会将数组的范围缩小一半,直到最后只剩下一个数
可以这么用数字表示:
N / 2 / 2 / 2 / 2 / 2 / 2 ...... / 2 / 2 = 1
假设查找了x次,也就是每次将数组缩小一半(除以2)这个基本操作执行了x次,那么这个x与N之间的关系是2^x = N
那么x = logN,这里默认底数为2
所以时间复杂度是O(logN)
实例7
计算阶乘递归Fac的时间复杂度
long long Fac(size_t N)
{
if (0 == N)
return 1;
return Fac(N - 1) * N;
}
基本操作递归了N次,所以时间复杂度为O(N)
实例8
计算斐波那契递归Fib的时间复杂度
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
基本操作递归了约为2^N次,根据推到大O阶的方法,所以最后的时间复杂度为O(N)
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
实例1
计算BubbleSort的空间复杂度
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
可见,红框标注的地方,是在函数的内部额外创建了4个变量,也就是开辟了常数个额外空间,所以空间复杂度为O(1)
实例2
计算Fibonacci的空间复杂度
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if (n == 0)
return NULL;
long long* fibArray = (long long*)malloc((n + 1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray[i - 2];
}
return fibArray;
}
在动态内存中开辟了N+1个sizeof(long long)大小的空间,所以空间复杂度为O(N)
实例3
计算阶乘递归Fac的空间复杂度
long long Fac(size_t N)
{
if (N == 0)
return 1;
return Fac(N - 1) * N;
}
递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间,所以空间复杂度为O(N)
实例4
计算Fibonacci的空间复杂度
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
每一次递归调用时,每两个子函数用的函数栈帧空间都是同一个,所以只额外开辟了N个栈帧,空间复杂度为O(N)
https://leetcode-cn.com/problems/missing-number-lcci/
题目描述:
数组nums包含从0到n的所有整数,但其中缺了一个。请编写代码找出那个缺失的整数。你有办法在O(n)时间内完成吗?
示例 1:
输入:[3,0,1]
输出:2
示例 2:
输入:[9,6,4,2,3,5,7,0,1]
输出:8
这里给出时间复杂度都为O(N)的思路
1.创建一个大小为N + 1的数组,然后用-1将数组初始化,再将题目中给定数组中的数字放到新创建数组中对应下标的位置,最后将新数组中的数字遍历一遍,找出-1所对应的下标,该下标的数字就是所要找的消失的数字了。
2.将题目给定数组中的数字全都异或一次,再与从0到N+1的数字全部异或一次,就可以得到那个消失的数字了,其思路类似于在一个数组中寻找单身狗。
3.将题目给定数组进行快速排序,而后进行二分查找,找不到的那个数字即为要找的数字了。
4.将N+1个数字进行全都加起来,然后减去题目给定数组中的N个数字,最后得到的数字就是要找的消失的数字了。
https://leetcode-cn.com/problems/rotate-array/
题目描述:
给你一个数组,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。
示例 1:
输入: nums = [1,2,3,4,5,6,7], k = 3
输出: [5,6,7,1,2,3,4]
解释:
向右轮转 1 步: [7,1,2,3,4,5,6]
向右轮转 2 步: [6,7,1,2,3,4,5]
向右轮转 3 步: [5,6,7,1,2,3,4]
示例 2:
输入:nums = [-1,-100,3,99], k = 2
输出:[3,99,-1,-100]
解释:
向右轮转 1 步: [99,-1,-100,3]
向右轮转 2 步: [3,99,-1,-100]
这里给出3种思路:
1.将最后一个数用一个临时变量保存起来,然后将数组中前面的数依次往后挪动,最后将临时变量中的数放到数组的第一个位置,这样的操作循环k次,最坏的情况下是k=N-1,这时时间复杂度是O(N^2),而空间复杂度是O(1),因为只开辟了1个临时变量,并且这个变量的空间是重复利用的。
2.额外开辟一个同样大小的数组,然后按照k的大小截取数据依次放入数组中,这种做法的时间复杂度为O(N),空间复杂度为O(N),这是以空间来换时间的做法。
3.根据k的大小将数组分位2个部分,第1个部分和第2个部分分别自旋,最后再将整个数组自旋一次,由于旋转交换的过程中只开辟了一个临时变量的空间,所以空间复杂度为O(1),时间复杂度为O(N)。
void reverse(int* nums, int left, int right)
{
while (left < right)
{
int tmp = nums[left];
nums[left] = nums[right];
nums[right] = tmp;
++left;
--right;
}
}
void rotate(int* nums, int numsSize, int k){
k %= numsSize;
reverse(nums, 0, numsSize - 1 - k);
reverse(nums, numsSize - k, numsSize - 1);
reverse(nums, 0, numsSize - 1);
}
关于算法的时间复杂度和空间复杂度就先讲到这里了,今后也会不定期更新。