算法的有穷性意味着不是所有的计算机程序都是算法
算法复杂性=计算机所需要的计算机资源=时间复杂度+空间复杂度
一般只考虑三种情况下的时间复杂性:最坏情况、最好情况和平均情况的复杂性。
Tmax(n)、Tmin(n)和Tavg(n)
常见的多项式限界函数
Ο(1) < Ο(logn) < Ο(n) < Ο(nlogn) < Ο(n2) < Ο(n3)
常见的指数时间限界函数
O(2n) < O(n!) < O(nn)
当n取值较大时,指数时间算法和多项式时间算法在计算时间上非常悬殊。
最优算法
问题的计算时间下界为Ω(f(n)),则计算时间复杂性为O(f(n))的算法是最优算法。
排序问题的计算时间下界是Ω(nlogn),则计算时间复杂性为O(nlogn)的排序算法是最优算法。
递归算法:直接或间接的调用自身的算法
递归函数:函数自身给出定义的函数
int fibonacci(int n){
if(n<=1){
return 1;
}else{
return fibonacci(n-1)+fibonacci(n-2);
}
}
优点:结构清晰,可读性强,而且容易用数学归纳法来证明算法的正确性,因此它为设计算法,调试程序带来很大方便。
缺点:递归算法的运行效率低,无论是耗费的计算时间还是占用的存储空间都比费递归算法高。
2. 基于分治法的递归
将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。
分治法所能解决的问题一般具有以下几个特征:
分治法的基本步骤:
分治法的复杂性分析——Master定理
分治法将规模为n的问题分解成k个规模为n/k的子问题。设分解阈值n=1,将原问题分解为k个子问题以及用merge将k个子问题的解合并成原问题的解需要f(n)个单位时间。
给定已按升序排好序的n个元素a[0:n-1],现在要从n个元素中找出一特定元素x
int binarySearch(int a[],int &x,int l,int r){
while(l <= r){
int mid = (l+r)/2;
if(a[mid] == x){
return mid;
}else if(a[mid] < x){
l = mid + 1;
}else{
r = mid - 1;
}
}
return -1;
}
算法复杂性分析:
每次执行一次算法的while循环,待搜索数组的大小减少一半。
最坏情况下,执行O(logn)次。
将待排序的元素分成大小大致相同的2个子集合,分别对2个子集合进行排序,最终将排好序的子集合合并成为所要求的排好序的集合。
void mergeSort(int a[],int l,int r){
if(l < r){ //至少有两个元素
int m = (l+r)/2;
mergeSort(a,l,m);
mergeSort(a,m+1,r);
merge(a,b,left,m,r);//合并到数组b
copy(a,b,l,r); //复制回数组a
}
}
void qSort(int p,int r)
{
if(p < r){
int q = partition(p,r); //以a[p]为基准元素将a[p:r]划分成3段a[p:q-1],a[q]和a[q+1:r],下标q再划分过程中确定。
qSort(p,q-1);
qSort(q+1,r);
}
}
int partition(int a[],int p,int r){
int i = p;
int j = r + 1;
int x = a[p];
while(true){
while(a[--j] >= x);
swap(a[i],a[j]);
while(a[++i] <= x && i < r);
if(i >= j){
break;
}
swap(a[i],a[j]);
}
return j;
}
问题描述:给定线性集中n个元素和一个整数k,要求找出n个元素中第k小的元素。当k=1时,找最小元素;k=n时,找最大的元素;k = (n+1)/2,找中位数。
int randSelect(int a[],int start,int end,int k){
if(start == end) return A[start];
int i = RandomizedPartition(A,start,end);
int n = i - start + 1; //左子数组A[start:i]的元素个数
if(k <= n){
return randSelect(a,start,i,k);
}else{
return randSelect(a,i+1,end,k-n);
}
}
在最坏情况下,随机线性选择需要O(n2)计算时间。
但可以证明,算法randomizedSelect可以在平均时间O(n)内找出n个输入元素中第k小的元素。
真正的线性时间选择
将n个输入元素划分成n/5,每组5个元素,只可能有一个组不足五个元素。用任意一种排序算法,将每组中的元素排好序,并取出它们每组中的中位数,共n/5个。
递归调用Select找出这n/5个元素的中位数,如果个数是偶数,就选取较大的一个作为划分基准。
int Select(int a[], int start, int end, int k){
if(end-start < 30){
用某个简单排序算法对数组a[start:end]排序;
return a[start+k-1];
}
for(int i = 0; i <= (end-start-4)/5; i++){
将a[start+i*5]到a[start+i*5+4]的第3小元素与a[start+i]交换位置;
}
//找出中位数的中位数
int x = Select(a,start,start+(end-start-4)/5,(end-start-4)/10);
int i = partition(a,start,end,x);
int n = i-start+1;
if(k <= n){
return Select(a,start,i,k);
}else{
return Select(a,i+1,end,k-n);
}
}
n个元素的数组调用select()需要T(n)
找中位数的中位数需要T(n/5)
使用基准得到两个子数组分别最多有3n/4个元素
分治法策略:将所有的选手分为两半,n个选手的比赛日程表可以通过n/2个选手设计的比赛日程表决定。
递归地对选手进行分割,直到只剩下两个选手时,只要让这两个选手进行比赛就可以了。