数据结构与算法学习笔记——时间复杂度和空间复杂度

最近在学习数据结构与算法,下面整理学习的步骤和笔记,以便日后查看,希望对读者有帮助。 若喜欢的话可以三连支持一下,谢谢!

事后统计法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。但这种方法显然是有很大缺陷的:必须依据算法事先编制好测试程序,通常需要花费大量时间精力,完了发觉测试的是糟糕的算法,那岂不是功亏一篑?
不同测试环境差别不是一般的大!

事前分析估算方法:在计算机程序编写前,依据统计方法对算法进行估算。
经过总结,我们发现一个高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:

  1. 算法采用的策略,方案
  2. 编译产生的代码质量
  3. 问题的输入规模
  4. 机器执行指令的速度

由此可见,抛开这些与计算机硬件、软件有关的因素,一个程序的运行时间依赖于算法好坏和问题的输入规模。(所谓问题的输入规模是指输入量的多少)

//算法1
int i,sum = 0,n = 100;   //执行了1次
for(i = 0;i <= n;i++)   //执行了n+1次
{
	sum = sum + i;      //执行了n次
}
cout<< sum <<endl;

//算法2
sum = (1 + n)*n/2;     //执行了1次

另一方面,我们研究算法的复杂度,侧重的是研究算法随着输入规模扩大增长量的一个抽象,而不是精确地定位需要执行多少次,因为如果这样的话,我们就又得开率回编译器优化等问题,然后,就永远没有然后了。。。

我们不关心编写程序所用的语言是什么,也不关心这些程程序将跑在什么样的计算机上,我们只关心它实现的算法。这样,不计那些循环索引的递增和循环终止条件、变量声明、打印结果等操作。最终,在分析程序的运行时间,最重要的是把程序看成是独立于程序设计语言的算法或一系列步骤。我们在分析一个算法的运行时间时,重要的是把基本操作的数量和输入模式关联起来。

当判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注主项(最高项)的阶数。
注意:判断一个算法好不好,我们只通过少量的数据是不能做出准确判断的,很容易以偏概全。

算法时间复杂度的定义:在进行算法分析时,语句总的执行次数T(n) 是关于问题规模n的函数,进而分析T(n) 随n的变化情况并确定T(n) 的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n) = O(T(n) )。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
记住: 执行次数 = 时间
这样用大写O()来体现算法时间复杂度的激发,我们称之为大O记法。
一般情况下,随着输入规模n的增大,T(n) 增长最慢的算法为最优算法。
显然,由此算法时间复杂度的定义可知,我们的三个求和算法的时间复杂度分别为O(1),O(n),O(n^2)。

攻略:
用常数1取代运行时间中的所有加法常数
在修改后的运行次数函数中,只保留最高阶。
如果最高阶项存在且不是1,则去除与这个项相乘的常数。
得到的最后结果就是大O阶。

线性阶
一般含有非嵌套循环设计线性阶,线性阶就是随着问题规模n的扩大,对应计算次数呈直线增长。

int i,sum = 0,n = 100;
for(i = 0;i <= n;i++)
{
	sum = sum + i;
}

上面这段代码,它的循环的时间复杂度为O(n),因为循环体中的代码需要执行n次。

平方阶

int i,j,n = 100;
for(i = 0;i < n;i++)
{
	for(j = 0;j < n;j++)
	{
		cout<<"I love fish"<<endl;
	}
}

n = 100,也就是说外层循环每执行一次,内层循环就执行100次,那总共程序想要从这两个循环出来,需要执行100 *100 次,也就是n的平方。所以这段代码的时间复杂度为 O(n * 2)。循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

int i,j,n = 100;
for(i = 0;i < n;i++)
{
	for(j = i;j < n;j++)
	{
		cout <<" I love fish"<< endl;
	}
}

由于当i= 0时,内循环执行了n次,当 i = 1 时,内循环则执行 n - 1 次…
当i = n-1时,内循环执行1次,所以总的执行次数应该是:
n + (n - 1) + (n - 2) + … + 1 = n(n+1)/2,也就是n^2/2 + n/2
大O攻略第一条忽略,因为没有常数相加,第二条只保留最高项,所以n/2这项去掉。第三条,去除与最高项相乘的常数,最终得O(n^2)。

对数阶

int i =1,n = 100;
while(i < n)
{
	i = i * 2;
}

由于每次 i*2 之后,就举例n更近一步,假设有x个2相乘大于或等于n,则会退出循环。于是哟2 ^ x = n得到 X= log(2)n,所以这个循环的时间复杂度为O(log n)。

常用的时间复杂度所耗费的时间从小到大依次是:O(1) < O(logn) < O(nlogn) < O(n^2) < O(n^3) < O(2 ^ n) < O(n!) < O(n ^ n)

算法的分析也是类似的,我们 查找一个有n个随机数字数组中的某个数字,最好的情况是第一个数字就是,那么算法的时间复杂度为O(1),但也有可能这个数字就在最后一个位置,那么时间复杂度为O(n)。
平均运行时间是期望的运行时间。

我们在写代码时,完全可以用空间来换取时间
举个栗子:要判断某年是不是闰年,你可能会花一点心思来写一个算法,每给一个年份,就可以通过这个算法计算得到是否闰年的结果。
另外一种方法是:事先建立一个有2050个元素的数组,然后把所有的年份按下表的数字对应,如果元素的值则为0。这样,所谓的判断某一年是否为闰年就变成了查找这个数组某一个元素的值的问题。

算法的空间复杂度通过计算算法所需的存储空间实现,算法的空间复杂度的计算公式记作:S(n) = O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。通常,我们都是用“时间复杂度”来指运行时间的需求,是用“空间复杂度”指空间需求。当直接要让我们求“复杂度”时,通常指的是时间复杂度。显然时间复杂度的追求更是属于算法的潮流。

你可能感兴趣的:(数据结构,算法)