数据结构和算法

数据结构和算法

  • 数据结构和算法
  • 算法
    • 算法效率
    • 时间复杂度
      • 大O的渐进表示法
      • 常见时间复杂度计算
    • 空间复杂度
    • 常见复杂度对比

数据结构和算法

数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。

算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

注:数据结构和算法是不分家的,数据结构中包含一些算法一些,而算法的解决又离不开数据结构。

算法

算法效率

复杂度计算是指衡量时间效率和空间效率

算法的复杂度:

  • 算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
  • 时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

补充:

  • 摩尔定律是英特尔创始人之一戈登·摩尔的经验之谈,其核心内容为:集成电路上可以容纳的晶体管数目在大约每经过18个月到24个月便会增加一倍。换言之,处理器(内存、CPU)的性能大约每两年翻一倍,同时价格下降为之前的一半。

时间复杂度

时间复杂度的概念

时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个
分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。

即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。

注:

  • 算法要计算准确的时间,需要跟运行环境有关
  • 时间复杂度计算的是程序运行的执行次数

实例一:

void Func1(int N)
{
	int count = 0;
	for (int i = 0; i < N ; ++ i)
	{
 		for (int j = 0; j < N ; ++ j)
 		{
 			++count;
 		}
	}
 
	for (int k = 0; k < 2 * N ; ++ k)
	{
 		++count;
	}
	int M = 10;
	while (M--)
	{
 		++count;
	}
	printf("%d\n", count);
}

注:上段代码的时间复杂度是O(N^2)

数据结构和算法_第1张图片

发现当N越大时函数的后两项对结果的影响越小。实际中计算时间复杂度时,其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里使用大O的渐进表示法

大O的渐进表示法

大O符号(Big O notation):是用于描述函数渐进行为的数学符号。

注:大O的渐进表示法是一种估算

推导大O阶方法:

  1. 用常数1取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项(保留对结果影响最大的一项),如果函数中有两个以及上未知数时阶数是一样的,都保留下来(或者取它们之中大的那一个)。
  3. 如果最高阶项存在且系数不是1,则去除与这个项目相乘的系数常数。得到的结果就是大O阶

使用大O的渐进表示法以后,Func1的时间复杂度为:

数据结构和算法_第2张图片

通过上面会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。

另外有些算法的时间复杂度存在最好、平均和最坏情况:

  • 最坏情况:任意输入规模的最大运行次数(上界)
  • 平均情况:任意输入规模的期望运行次数
  • 最好情况:任意输入规模的最小运行次数(下界)

例如:在一个长度为N数组中搜索一个数据x

  • 最好情况:1次找到
  • 最坏情况:N次找到
  • 平均情况:N/2次找到

在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)

注:

  • O(1)在复杂度中1不是代表1次,而是代表常数次

常见时间复杂度计算

实例一:

void Func2(int N)
{
 	int count = 0;
 	for (int k = 0; k < 2 * N ; ++ k)
 	{
 		++count;
 	}
 	int M = 10;
 	while (M--)
 	{
 		++count;
 	}
 	printf("%d\n", count);
}

注:时间复杂度O(N)

实例二:

void Func3(int N, int M)
{
 	int count = 0;
 	for (int k = 0; k < M; ++ k)
 	{
 		++count;
 	}
 	for (int k = 0; k < N ; ++ k)
 	{
 		++count;
 	}
 	printf("%d\n", count);
}

注:时间复杂度O(M+N) 或者O(max(M,N))

实例三:

void Func4(int N)
{
 	int count = 0;
 	for (int k = 0; k < 100; ++ k)
 	{
 		++count;
 	}
 	printf("%d\n", count);
}

注:时间复杂度为O(1)

实例四:

const char * strchr ( const char * str, int character );

注:

  • 时间复杂度为O(N)
  • 当有些算法的时间复杂度存在最好、平均和最坏情况,一般情况关注的是算法的最坏运行情况。用最坏情况去衡量这样的算法,因为最坏的情况是靠谱的这个算法一定不会比这种情况更差了。它是一种保底思维。

实例五:

void BubbleSort(int* a, int n)
{
 	assert(a);
 	for (size_t end = n; end > 0; --end)
	{
 		int exchange = 0;
 		for (size_t i = 1; i < end; ++i)
 		{
 			if (a[i-1] > a[i])
 			{
 				Swap(&a[i-1], &a[i]);
 				exchange = 1;
 			}
 		}
 		if (exchange == 0)
 			break;
 	}
}

注:时间复杂度为O(N^2)

平均情况是最坏情况除2

实例六:

int BinarySearch(int* a, int n, int x)
{
 	assert(a);
 	int begin = 0;
 	int end = n-1;
 	while (begin < end)
 	{
 		int mid = begin + ((end-begin)>>1);
 		if (a[mid] < x)
 			begin = mid+1;
 		else if (a[mid] > x)
 			end = mid;
 	else
 		return mid;
 	}
 	return -1;
}

注:

  • 时间复杂度为O(logN)
  • 算法里面很多时候,如果不是编辑器支持,不好敲底数。所以一般情况复杂度计算,可以把简化成logN(省略底数)。有不少书上或者网上的资料还喜欢简化成O(lgN)严格来说这个是不对,因为跟数学中就混了,所以要注意不要这样写,但是如果别人这样写了,也要知道他其实是想表达以2为底的对数。但是底数不是2时其他地方不要简化。

实例七:

long long Fac(size_t N)
{
 if(1 == N)
 return 1;
 
 return Fac(N-1)*N;
}

注:

  • 时间复杂度为O(N)
  • 递归算法时间复杂度计算是递归次数乘以每次递归调用中的次数(每次递归的累计次数相加)

实例八:

long long Fib(size_t N)
{
 if(N < 3)
 return 1;
 
 return Fib(N-1) + Fib(N-2);
}

注:时间复杂度为O(2^N)

实例答案及分析:

  1. 实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)
  2. 实例2基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M)
  3. 实例3基本操作执行了10次,通过推导大O阶方法,时间复杂度为 O(1)
  4. 实例4基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N)
  5. 实例5基本操作执行最好N次,最坏执行了(N*(N+1)/2次,通过推导大O阶方法+时间复杂度一般看最坏,时间复杂度为 O(N^2)
  6. 实例6基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN) ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN。
  7. 实例7通过计算分析发现基本操作递归了N次,时间复杂度为O(N)。
  8. 实例8通过计算分析发现基本操作递归了2^N 次,时间复杂度为O(2^N)。

空间复杂度

  • 空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。(是对一个算法在运行过程中最多临时占用存储空间的个数)

  • 空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。

  • 空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。

  • 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

实例一:

void BubbleSort(int* a, int n)
{
 	assert(a);
 	for (size_t end = n; end > 0; --end)
 	{
 		int exchange = 0;
 		for (size_t i = 1; i < end; ++i)
 		{
 			if (a[i-1] > a[i])
 			{
 				Swap(&a[i-1], &a[i]);
 				exchange = 1;
 			}
 		}
 		if (exchange == 0)
 			break;
 	}
}

注:

  • a这个数组不是临时的,是存储数据的,不是算法过程中因为算法需要而开辟的 。
  • 空间复杂度为O(1)
  • 时间是累计的,但是空间是不累计的(可以重复利用的)

实例二:

long long* Fibonacci(size_t n)
{
 	if(n==0)
 		return NULL;
 
 	long long * fibArray = (long long *)malloc((n+1) * sizeof(long 	long));
 	fibArray[0] = 0;
 	fibArray[1] = 1;
 	for (int i = 2; i <= n ; ++i)
 	{
 		fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
 	}
 	return fibArray;
}

注:空间复杂度为O(N)

实例三:

long long Fac(size_t N)
{
 	if(N == 0)
 		return 1;
 
 	return Fac(N-1)*N;
}

注:空间复杂度为O(N)

实例四:

long long Fib(size_t N)
{
 if(N < 3)
 return 1;
 
 return Fib(N-1) + Fib(N-2);
}

注:空间复杂度为O(N)

实例答案及分析:

  1. 实例1使用了常数个额外空间,所以空间复杂度为 O(1)
  2. 实例2动态开辟了N个空间,空间复杂度为 O(N)
  3. 实例3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)
  4. 实例4最多递归调用了N-1次,开辟了N-1个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)

常见复杂度对比

一般算法常见的复杂度如下:

数据结构和算法_第3张图片

各个算法维度的性能如下:
数据结构和算法_第4张图片

注:

  • 二分查找理论上是非常牛的算法,但是它需要数据有序,有序是要付出代价的。所以它实际中进行查找用的并没有那么多。查找依赖的数据结构有搜索树、AVL树、红黑树、B树、哈希表

你可能感兴趣的:(数据结构,数据结构,算法,java,c语言,c++)