算法导论-希尔排序、桶排序

一、希尔排序
基本思想

   先取一个小于n的整数d1作为第一个增量,把文件的全部记录分成(n除以d1)个组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序;然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量dt=1(dt<dt-l<…<d2<d1),即所有记录放在同一组中进行直接插入排序为止。


c语言实现:

void shellSort(elementType *r,int n) {      int j,i,gap;      elementType tmp;      gap=n/2;      while(gap>0)      {           for(i=gap;i<n;i++)           {                j=i-gap;                while(j>=0)                {                     if(r[j]>r[j+gap])                     {                         tmp=r[j];                         r[j]=r[j+gap];                         r[j+gap]=tmp;                         //往前移动一个gap的位置,继续比较                         j=j-gap;                     }                     //跳出循环                     else j=-1;                }           }           gap/=2;      } } 

算法分析
    不需要大量的辅助空间,和归并排序一样容易实现。希尔排序是基于插入排序的一种算法, 在此算法基础之上增加了一个新的特性,提高了效率。希尔排序的时间复杂度为 O(N*(logN)2), 没有快速排序算法快 O(N*(logN)),因此中等大小规模表现良好,对规模非常大的数据排序不是 最优选择。但是比O(N2)复杂度的算法快得多。并且希尔排序非常容易实现,算法代码短而简单。 此外,希尔算法在最坏的情况下和平均情况下执行效率相差不是很多,与此同时快速排序在最坏 的情况下执行的效率会非常差。 专家们提倡,几乎任何排序工作在开始时都可以用希尔排序,若在实际使用中证明它不够快, 再改成快速排序这样更高级的排序算法. 本质上讲,希尔排序算法的一种改进,减少了其复制的次数,速度要快很多。 原因是,当N值很大时数据项每一趟排序需要的个数很少,但数据项的距离很长。 当N值减小时每一趟需要交换的数据增多,此时已经接近于它们排序后的最终位置。 正是这两种情况的结合才使希尔排序效率比插入排序高很多。


二、桶排序

基本思想
 假定输入是由一个随机过程产生的[0, 1)区间上均匀分布的实数。把区间[0,1)划分成n个相同大小的子区间,或称桶,然后将n个输入数分布到各个桶中去。因为输入数均匀分布在[0,1)上,所以一般不会有很多数落在一个桶中的情况。为得到结果,先对各个桶中的数进行排序,然后按次序把各桶中的元素列出来即可。

c语言实现

/*BucketSort*/ void bucketSort(elementType * r,int len) { 	elementType *buckets[10];//指针数组 	int n=1;//用于取整数各位上的值 	int index;//数组下标计数索引 	int indexs[10];//各个桶下标计数索引 	int i,j;  	//分配动态内存作为桶 	for(i=0;i<10;++i) 		buckets[i]=(elementType *)malloc(sizeof(elementType)*len);  		//计数索引清零 		index=0; 		for(i=0;i<10;++i) 			indexs[i]=0;  		//数组至桶 		for(i=0;i<len;++i) 		{ 		    n=(int)(r[i]*10); 		    //printf("%d   ",n); 		    buckets[n][indexs[n]++]=r[i]; 		}          //sort every bucket         for(i=0;i<10;++i)         {             quickSort(buckets[i],indexs[i]);         } 		//桶至数组 		for(i=0;i<10;++i) 			for(j=0;j<indexs[i];++j) 				r[index++]=buckets[i][j];    	//释放动态内存 	for(i=0;i<10;++i) 		free(buckets[i]); } 

这里利用快速排序为每个桶进行排序,运行结果:


算法分析
桶排序的平均时间复杂度为线性的O(N+C),其中C=N*(logN-logM)。如果相对于同样的N,桶数量M越大,其效率越高,最好的时间复杂度达到O(N)。当然桶排序的空间复杂度为O(N+M),如果输入数据非常庞大,而桶的数量也非常多,则空间代价无疑是昂贵的。此外,桶排序是稳定的。


参考:百度百科

你可能感兴趣的:(算法导论-希尔排序、桶排序)