一个C语言实现不含递归的高效快速排序算法

近来编写一个对性能要求很高的程序,要用到排序功能。要排序的数据类型有很多种,有整数、浮点数、各种结构(根据某个属性进行比较)等。如果调用libc的qsort()函数,调用比较函数的开销将会很大。因此就产生自己写一个排序函数的想法。由于数据类型的多样性,因此算法要有一定通用性。但我又不想用调用比较函数的开销,因此只能用宏来实现了。由于快速排序是目前最快的通用排序算法,因此当前选用快速排序算法。我选用Bentley-McIlroy的三路划分快速排序法,原型如下:

void quicksort(Item a[], int l, int r)
{ 
  int i = l-1, j = r, p = l-1, q = r; Item v = a[r];
  if (r <= l) return;
  for (;;) {
    while (a[++i] < v) ;
    while (v < a[--j]) if (j == l) break;
    if (i >= j) break;
    exch(a[i], a[j]);
    if (a[i] == v) { p++; exch(a[p], a[i]); }
    if (v == a[j]) { q--; exch(a[j], a[q]); }
  }
  exch(a[i], a[r]); j = i-1; i = i+1;
  for (k = l; k < p; k++, j--) exch(a[k], a[j]);
  for (k = r-1; k > q; k--, i++) exch(a[i], a[k]);
  quicksort(a, l, j);
  quicksort(a, i, r);
}
但快速排序是采用分治法进行排序,因此有函数的递归调用。这就给用宏实现算法带来困难。没有办法,只好用堆栈来模拟了。但堆栈有可能溢出,在溢出的时候还是要用libc的qsort()来对未排序的部分数据进行排序,但一但情况下是用不到的。最后完成的排序算法如下(其中在数据量较少时转而用插入排序是我增加的内容):
#define LIBCSwap(x, y, t) (t) = (x); (x) = (y); (y) = (t)
#define LIBCSimpleLt(x, y)  ((x) < (y))
#define LIBCSimpleEq(x, y)  ((x) == (y))
extern int LIBCIntCmp(const void *x, const void *y);
#define LIBCQuickSort(TYPE, pDat, nCnt, pLtFunc, pEqFunc, pCmpFunc) /
do {/
 int stack[1024], top = 1, l, r, k, i, j, p, q; /
 TYPE v, t;      /
 /* stack保存要排序数据的起止点 */
 stack[0] = 0;    /    
 stack[1] = (nCnt) - 1;  /
 while (top >= 0) {   /
  r = stack[top--]; l = stack[top--];  /
  /* 从堆栈中弹出要排序数据范围,即排序[l, r]之间的数据 */
  i = l - 1; j = r; p = i; q = r;   /
  v = (pDat)[r];       /
  /* 在数据量比较少时改用插入排序 */
  if (r <= l + 31)       /
   continue;          /
  for (;;) {           /
   while (pLtFunc((pDat)[++i], v));    /
   while (pLtFunc(v, (pDat)[--j])) if (j == l) break;  /
   if (i >= j) break;        /
   LIBCSwap((pDat)[i], (pDat)[j], t);    /
   if (pEqFunc((pDat)[i], v)) { p++; LIBCSwap((pDat)[p], (pDat)[i], t); }  /
   if (pEqFunc(v, (pDat)[j])) { q--; LIBCSwap((pDat)[j], (pDat)[q], t); }  /
  }             /
  LIBCSwap((pDat)[i], (pDat)[r], t);     /
  j = i - 1; i++;         /
  for (k = l; k < p; k++, j--) { LIBCSwap((pDat)[k], (pDat)[j], t); }  /
  for (k = r - 1; k > q; k--, i++) { LIBCSwap((pDat)[i], (pDat)[k], t); } /
  if (top < 1019){         /
   /* 相当于递归调用qsort(pDat, l, j) */
   stack[++top] = l; stack[++top] = j;    /
   /* 相当于递归调用qsort(pDat, i, r) */
   stack[++top] = i; stack[++top] = r;    /
  }             /
  else {            /
   /* 堆栈溢出,调用libc的qsort() */
   qsort((pDat), j - l + 1, sizeof(TYPE), pCmpFunc);  /
   qsort((pDat) + i, r - i + 1, sizeof(TYPE), pCmpFunc); /
  }               /
 }                /
 /* 插入排序 */
 for (i = 1; i < nCnt; i++) {  /
  t = (pDat)[i];     /
  for (j = i; j > 0 && pLtFunc(t, (pDat)[j - 1]); j--) /
   (pDat)[j] = (pDat)[j - 1]; /
  (pDat)[j] = t;     /
 }         /
} while(0);

这样,用:

LIBCQuickSort(int, pDat, nCnt, LIBCSimpleLt, LIBCSimpleEq, LIBCIntCmp);
就可以完成对一个整数数组的排序。在我的机器上,该函数排序整型数据的效率大概是libc中qsort()的2.5倍。
当然效率的提高也有副作用,比如要定义三个比较函数,而原来只要一个(有时候也可以简化,如LIBCSimpleLt函数实际上可用于任何简单类型的比较),在调用排序之前要对数据类型进行判断(一大堆switch..case)。另外,我对堆栈溢出时的处理方式总是不满意,搞来搞去还是要调用libc,因此把这个算法写出来,大家看看还能如何改进?

你可能感兴趣的:(程序设计,算法,语言,c)