数据结构——复杂度

算法的复杂度

  算法在编写成可执行程序后,运行时需要耗费时间资源和空间 ( 内存 ) 资源 。因此 衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的 ,即时间复杂度和空间复杂度。
  时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间 。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

时间复杂度 

时间复杂度的定义:在计算机科学中, 算法的时间复杂度是一个函数(数学关系) ,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知 道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例, 算法中的基本操作的执行次数,为算法 的时间复杂度。

下面通过我们熟知的冒泡排序和快速排序(qsort)对比,来体现出复杂度的差异:同样排序N个数,冒泡排序的复杂度O(N*N);而qsort的复杂度O(N*logN)。再举个例子:

void Func1 ( int N )
{
int count = 0 ;
for ( int i = 0 ; i < N ; ++ i )
{
for ( int j = 0 ; j < N ; ++ j )
{
++ count ;
}
}
for ( int k = 0 ; k < 2 * N ; ++ k )
{
++ count ;
}
int M = 10 ;
while ( M -- )
{
++ count ;
}
printf ( "%d\n" , count );
}
该函数执行操作的次数F(N)= N * N+2*N+10   这个就是该函数准确的时间复杂度。在实际生活中,我们通常用大O来进行建议表示(随着N的增大,后两项对整体结果影响不大)

空间复杂度

空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。(为了解决算法问题而额外开辟的变量)
空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定

应用1

//冒泡排序空间复杂度O(1)
void BubbleSort(int* a, int n) { 1234567812345678123
 assert(a);
 for (size_t end = n; end > 0; --end)
 {
 int exchange = 0;
 for (size_t i = 1; i < end; ++i)
 {
 if (a[i-1] > a[i])
 {
 Swap(&a[i-1], &a[i]);
 exchange = 1;
 }
 }
 if (exchange == 0)
 break;
 }
}

计算算法中临时额外开辟的空间。end,exchange,swap,共四个额外开辟的空间(数组是给定的)。时间是累积的,空间是不累计的,每一次循环的exchange用的是相同的空间。

应用2 斐波那契数列的前n项

long long* Fibonacci ( size_t n )
{
if ( n == 0 )
return NULL ;
long long * fibArray = ( long long * ) malloc (( n + 1 ) * sizeof ( long long ));
fibArray [ 0 ] = 0 ;
fibArray [ 1 ] = 1 ;
for ( int i = 2 ; i <= n ; ++ i )
{
fibArray [ i ] = fibArray [ i - 1 ] + fibArray [ i - 2 ];
}
return fibArray;
}
这里的malloc是数组开辟的,并不是因为这个算法额外开辟。所以空间复杂度是O(n)
应用3 递归的空间复杂度O(n)
long long Fac ( size_t N )
{
if ( N == 0 )
return 1 ;
return Fac ( N - 1 ) * N ;
}
递归调用了n次,开辟了n个栈帧,每个栈帧使用了常数个空间
应用4  斐波那契数列的空间复杂度O(n)
先调用n,n再调用n-1,n-1再调用n-2.......以此类推。当返回再次开始调用时栈帧结束了,栈帧里空间没有被销毁,是重复利用的 数据结构——复杂度_第1张图片

类型一样,变量个数一样,打印出来的地址就相同 

常见复杂度对比 

数据结构——复杂度_第2张图片

一般到了指数阶就不能用了。 

 

O的渐进表示法  

大O符号(Big O notation):是用于描述函数渐进行为的数学符号。通俗的说,时间复杂度估算就是算他属于哪个量级的算法
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为 O(N^2)
N = 10 F(N) = 100
N = 100 F(N) = 10000
N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
下面通过例题计算
void Func4 ( int N )
{
int count = 0 ;
for ( int k = 0 ; k < 100 ; ++ k )
{
++ count ;
}
printf ( "%d\n" , count );
}
这里复杂度为O(1) 注:这里的O中的1表示的不是数字,表示的是常数次,函数里的k无论小于的是100或者是10000,都写成O(1).因为现在的计算机每秒执行指令的次数为上亿次

void Func3 ( int N , int M )
{
int count = 0 ;
for ( int k = 0 ; k < M ; ++ k )
{
++ count ;
}
for ( int k = 0 ; k < N ; ++ k )
{
++ count ;
}
printf ( "%d\n" , count )
}
若题中没有给出N和M的大小关系时,记为O(N+M),若M远大于N,记为O(M),反之,记为O(N) 若相等,记为O(M)或者O(N)

void BubbleSort ( int* a , int n )
{
assert ( a );
for ( size_t end = n ; end > 0 ; -- end )
{
int exchange = 0 ;
for ( size_t i = 1 ; i < end ; ++ i )
{
if ( a [ i - 1 ] > a [ i ])
{
Swap ( & a [ i - 1 ], & a [ i ]);
exchange = 1 ;
}
}
if ( exchange == 0 )
break ;
}
}
时间复杂度准确值:F(N)= N-1+N-2+...+1 = N*(N-1)/2
                  近似值:O(N^2)

二分查找

int BinarySearch ( int* a , int n , int x )
{
assert ( a );
int begin = 0 ;
int end = n - 1 ;
// [begin, end] begin end 是左闭右闭区间,因此有 =
while ( begin <= end )
{
int mid = begin + (( end - begin ) >> 1 );
if ( a [ mid ] < x )
begin = mid + 1 ;
else if ( a [ mid ] > x )
end = mid - 1 ;
else
return mid ;
}
return - 1 ;
}

 最好的情况O(1)

最差的情况O(log2N)

N/2/2/2/2/2....=1

折半了多少次就除多少个2,假设查找了x次

2^x=N   x=log2N

时间复杂度是计算算法执行次数,一个执行次数,可能是多条语句,但一定是常数条。时间复杂度的log2N因为经常出现,我们把它简写为logN。log3等其余的数该怎么写怎么写。

面试题 

思路一:遍历

思路二:异或

思路三:排序+二分查找

思路四:公式计算

数据结构——复杂度_第3张图片

数据结构——复杂度_第4张图片

你可能感兴趣的:(数据结构,数据结构)