算法的时间复杂度推导方法
独立博客地址:chugang.net
语句频度
语句频度是指语句的重复执行次数。
推导大O阶方法
方法
- 用常数1取代运行时间中的所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去除与这个项相乘的乘数。
常数阶举例运用
右侧注释中的 num
表示语句执行的次数。
int sum = 0, n = 100; /* num = 1 */
sum = (n+1) * n / 2; /* num = 1 */
printf("%d", sum); /* num = 1 */
这段代码的运行次数函数是 f(n) = 1 + 1 + 1
,根据“推导大O阶方法”中的第一条规则,把
1 + 1 + 1
用 1
替换,运行次数函数变成了 f(n) = 1
。该函数只有常数项,只需使用规
则1就可以推导出它即这段代码的时间复杂度是 O(1)
。
假如 sum = (n+1) * n / 2
执行3次,将上面的代码修改为:
int sum = 0, n = 100; /* num = 1 */
sum = (n+1) * n / 2; /* num = 1 */
sum = (n+1) * n / 2; /* num = 1 */
sum = (n+1) * n / 2; /* num = 1 */
printf("%d", sum); /* num = 1 */
这段代码的运行次数函数是 f(n) = 1 + 1 + 1 + 1 + 1
。 按照推导大O阶第一条规则,用1取代
所有的加法常数,这段代码的运行次数函数是 f(n) = 1
。这段代码的时间复杂度依然是 f(n) = O(1)
。
所有这类代码的时间复杂度都是 O(1)
。O(1)
叫做常数阶。不存在 O(2)
、 O(9)
这类写法。
线性阶举例运用
code-3
int i;
for(i = 0; i < n; i++){
// 时间复杂度为O(1)的代码
}
code-3
的运行次数函数是 f(n) = n * 1
。加法常数为0个,跳过规则一。变量n的最高阶是 n * 1
,无
其他项,跳过规则二。n * 1
中的系数本来就是1,也可以直接跳过规则三,得到code-3
的时间复杂度是
f(n) = O(n)
。
code-4
int i;
for(i = 0; i < n; i++){
// 时间复杂度为O(1)的代码
}
int j;
for(j = 0; j < m; j++){
// 时间复杂度为O(1)的代码
}
code-4
的运行次数函数是f(n) = n * 1 + m * 1
。直接跳过规则一。n * 1 + m * 1
有两个变量,
但次数都是1,任何一项 n * 1
或 m * 1
都可视为最高价,根据推导规则二“保留最高阶”,得出
运行次数函数是f(n) = n * 1
或 f(n) = m * 1
。最后根据规则三,得出code-4
的时间复杂度是
f(n) = O(n)
。
对数阶举例运用
code-5
int count = 1;
while(count < n){
count = count * 2;
//其他时间复杂度为O(1)的代码
}
code-5
似乎不能用前面的推导大O阶方法来分析时间复杂度,我从《数据结构与算法分析》P21找到了分析
"运行时间中的对数"的一般法则。这个一般法则是:
如果一个算法用常数时间(O(1)将问题的大小削减为其一部分(通常是1/2),那么该算法就是
O(log N)
。
另一方面,如果使用常数时间只是把问题减少一个常数(如将问题减少1),那么这种算法就是O(N)
。
code-5
中,假设 n = 8
,初始化时,while(count < n)
需要运行8次。经过一次循环后,count变为2,
循环需要运行4次,变为原来的一半。根据那条一般法则,判断 code-5
的时间复杂度是 O(log N)
。
将code-5
修改为code-6
,
int count = 1;
while(count < n){
count = count + 2;
//其他时间复杂度为O(1)的代码
}
code-6
每次执行循环后,会把问题减少2个常数,时间复杂度应为 O(N)
。
若将code-6
中的count = count + 2
改为code = count - 2
,时间复杂度仍然是 O(N)
。但我有点理解不了。
平方价举例运用
code-7
int i, j; /*1*/
for(i = 0; i < n; i++){ /*2*/
for(j = 0; j < n; j++){ /*3*/
//时间复杂度为O(1)的代码 /*4*/
} /*5*/
} /*6*/
code-7
中第二个循环体的时间复杂度是O(N)
。第一个循环体将第二个循环体再执行N次,时间复杂度变为O(N2)
。
如果将第二个循环体中的n
改为m
,那么code-7
的时间复杂度就是O(N*M)
。注意,O(N*M)
和O(N2)
都叫做
平方阶,二者实质相同。
多层循环体的时间复杂度就是每层循环体的运行次数相乘。
code-8
int i, j;
for(i = 0; i < n; i++){
for(j = i; j < n; j++){
//时间复杂度为O(1)的代码
}
}
code-8
运行次数是(n+1)*n*n/2
。只保留最高阶并且去掉它的系数,时间复杂度是O(N2)
。有些地方理解不了。
code-9
void function(int count){
int j;
for(j = count; j < n; j++){
printf("%s", "hello,world");
}
}
n++; /* num = 1 */
function(n); /* num = n */
int i,j; /* num = 1 */
for(i = 0; i < n; i++){ /* num = n*n */
function(i);
}
for(i = 0; i < n; i++){ /* num = (n+1)*n/2 */
for(j = i; j < n; j++){
printf("%s", "hi");
}
}
code-9
的时间复杂度是多少呢?
首先将每行代码的执行次数标出来。
code-9
的执行次数(首先忽略掉常数项)是n + n*n + (n+1)*n/2
,计算结果为1.5*n*n + 2*n
。
只保留最高阶1.5*n*n
,最后将系数变为1,执行次数为n*n
,时间复杂度为O(N2)
。
这种方法有不确定性的因素存在,或者说,在计算执行次数的时候,使用了互相矛盾的方法。
独立博客地址:chugang.net
重新思考之后,发现并不存在矛盾,而是《大话数据结构》中推导时间复杂度的方法有小缺陷。这个推导
本身就是一种粗略估计,为何在推导过程中有时又在进行精确计算呢?以code-8
为例,该书使用了精确
的计算方法。若全部都坚持使用粗略估计计算,那么计算过程是这样的:code-8
中第二个循环体的运行
次数是N,或者抽象为“一个变量”,第一个循环体的运行次数也是N或M,也抽象为“一个变量”,整体的运行
次数为两个变量相乘,即时间复杂度为O(N2)
。这种粗略估计计算方法,建立的基础是:影响循环执行次数
的变量只有那个与循环终止条件相关的变量,与起始变量无关。
这种方法,又不能适用于对数阶的时间复杂度推导。或许,对数阶中的循环,本来就是一种特殊情况,不能
采用普通循环的推导方法。此处存疑。*
常见的时间复杂度
直接摘抄《大话数据结构》中的有关部分。
理解不了这些时间复杂度所耗时间的顺序,应该如何比较它们所耗时间?
独立博客地址:chugang.net