希尔排序(Shell Sort)又叫做缩小增量排序(diminishing increment sort),是一种很优秀的排序法,算法本身不难理解,也很容易实现,而且它的速度很快。
插入排序(Insertion Sort)的一个重要的特点是,如果原始数据的大部分元素已经排序,那么插入排序的速度很快(因为需要移动的元素很少)。从这个事实我们可以想到,如果原始数据只有很少元素,那么排序的速度也很快。
希尔排序就是基于这两点对插入排序作出了改进。
增量数列的选择对希尔排序的性能有着极大的影响。[Mark Allen Weiss]指出,最好的增量序列是 Sedgewick提出的 (1, 5, 19, 41, 109,...),该序列的项来自 9 * 4^i - 9 * 2^i + 1 和 4^i - 3 * 2^i + 1 这两个算式。
下面是一个使用 Sedgewick增量 的希尔排序的完整C语言程序:
/* kikistar.com - 使用 Sedgewick增量 的 Shell Sort 程序 */ #include #include #include #define MAX 1000000 //这里设定要对多少个元素排序 void shellsort(int A[], int N, int *); void printarray(int A[]); int main() { int i, s[MAX]; int *sed; int sedgewick[] = { // Sedgewick增量 1073643521, 603906049, 268386305, 150958081, 67084289, 37730305, 16764929, 9427969, 4188161, 2354689, 1045505, 587521, 260609, 146305, 64769, 36289, 16001, 8929, 3905, 2161, 929, 505, 209, 109, 41, 19, 5, 1, 0 }; //用 0 标记终点 for (sed = sedgewick; *sed > MAX; sed++) // 增量必须小于元素个数 /* void */; for (i = 0; i < MAX; i++) s[i] = 1+(int) ((float)MAX*rand()/(RAND_MAX+1.0)); printf("before :"); printarray(s); shellsort(s, MAX, sed); printf("after :"); printarray(s); return 0; } /* Shell Sort: 把增量序列放在数组里 */ void shellsort(int v[], int n, int *sed) { int i, j, temp; int *gap; for (gap = sed; *gap > 0; gap++) for (i = *gap; i < n; i++) for (j = i - *gap; j>=0 && v[j]>v[j + *gap]; j -= *gap) { temp = v[j]; v[j] = v[j + *gap]; v[j + *gap] = temp; } } void printarray(int a[]) { int i; for (i = 0; i < MAX; i++) printf(" %d", a[i]); printf("/n"); }
在Linux下可以这样测试程序的运行时间:
$ time ./a.out >/dev/null
real 0m2.603s
user 0m2.549s
sys 0m0.019s
上面是在我的机器里,把 MAX 设定为 1000000 时的运行时间。
Sedgewick增量可用像下面那样的程序求得。
/* 计算 Sedgewick增量 的程序 */
#include #include #include #define wick 100 void insertsort(int A[], int N); void printarray(int A[], int from, int to); int main() { int i, j; int sedge[wick]; i = -1; do { ++i; sedge[i] = 9 * pow(4,i) - 9 * pow(2,i) + 1; printf("sedge[%d] = %d/n", i, sedge[i]); } while (sedge[i] > 0); printf("/n"); j = 1; do { ++j; // j = 0 和 j = 1 时该算式的解小于0,所以从 j = 2 开始取值。 sedge[j+i-2] = pow(4,j) - 3 * pow(2, j) + 1; printf("sedge[%d] = %d/n", j+i-2, sedge[j+i-2]); } while (sedge[j+i-2] > 0); printf("/n"); printarray(sedge, 0, j+i-2); insertsort(sedge, j+i-2); printarray(sedge, 0, j+i-2); return 0; } void printarray(int a[], int from, int to) { int i; for (i = from; i < to; i++) printf("%d, ", a[i]); printf("/n/n"); } /* 从大到小排序 */ void insertsort(int A[], int n) { int i, j, key; for (j = 1; j < n; j++) { key = A[j]; i = j - 1; while (i >= 0 && A[i] < key) { A[i+1] = A[i]; --i; } A[i+1] = key; } }
由于用了 math.h,用 GCC 编译时注意要加上 -lm 参数。
$ gcc -Wall sedgewick.c -lm