排序算法是我们编程中遇到的最多的算法。目前主流的算法有8种。
平均时间复杂度从高到低依次是:
冒泡排序(o(n2)),选择排序(o(n2)),插入排序(o(n2)),堆排序(o(nlogn)),
归并排序(o(nlogn)),快速排序(o(nlogn)), 希尔排序(o(n1.25)),基数排序(o(n))
这些平均时间复杂度是参照维基百科排序算法罗列的。
是计算的理论平均值,并不意味着你的代码实现能达到这样的程度。
例如希尔排序,时间复杂度是由选择的步长决定的。基数排序时间复杂度最小,
但我实现的基数排序的速度并不是最快的,后面的结果测试图可以看到。
本文代码实现使用的数据源类型为IList
List
选择排序是我觉得最简单暴力的排序方式了。
以前刚接触排序算法的时候,感觉算法太多搞不清,唯独记得选择排序的做法及实现。
原理:找出参与排序的数组最大值,放到末尾(或找到最小值放到开头) 维基入口
实现如下:
public static void SelectSort(IList<int> data) { for (int i = 0; i < data.Count - 1; i++) { int min = i; int temp = data[i]; for (int j = i + 1; j < data.Count; j++) { if (data[j] < temp) { min = j; temp = data[j]; } } if (min != i) Swap(data, min, i); } }
过程解析:将剩余数组的最小数交换到开头。
冒泡排序是笔试面试经常考的内容,虽然它是这些算法里排序速度最慢的(汗),后面有测试为证。
原理:从头开始,每一个元素和它的下一个元素比较,如果它大,就将它与比较的元素交换,否则不动。
这意味着,大的元素总是在向后慢慢移动直到遇到比它更大的元素。所以每一轮交换完成都能将最大值
冒到最后。 维基入口
实现如下:
public static void BubbleSort(IList<int> data) { for (int i = data.Count - 1; i > 0; i--) { for (int j = 0; j < i; j++) { if (data[j] > data[j + 1]) Swap(data, j, j + 1); } } }
过程解析:中需要注意的是j
很多网上版本每轮冒完泡后依然还是将所有的数进行第二轮冒泡即j 在维基上看到,可以通过添加标识来分辨剩余的数是否已经有序来减少比较次数。感觉很有意思,可以试试。 实现如下: 过程解析:发现某轮冒泡没有任何数进行交换(即已经有序),就跳出排序。 我起初也以为这个方法是应该有不错效果的,可是实际测试结果并不如想的那样。和未优化耗费时间一样(对于随机数列)。 由果推因,那么应该是冒泡排序对于随机数列,当剩余数列有序的时候,也没几个数要排列了!? 不过如果已经是有序数列或者部分有序的话,这个冒泡方法将会提升很大速度。 冒泡排序只是单向冒泡,而鸡尾酒来回反复双向冒泡。 原理:自左向右将大数冒到末尾,然后将剩余数列再自右向左将小数冒到开头,如此循环往复。维基入口 实现如下: 过程解析:分析第i轮冒泡,i是偶数则将剩余数列最大值向右冒泡至末尾,是奇数则将剩余数列最小值 向左冒泡至开头。对于剩余数列,n为始,data.Count-1-m为末。 来回冒泡比单向冒泡:对于随机数列,更容易得到有序的剩余数列。因此这里使用标识将会提升的更加明显。 插入排序是一种对于有序数列高效的排序。非常聪明的排序。只是对于随机数列,效率一般,交换的频率高。 原理:通过构建有序数列,将未排序的数从后向前比较,找到合适位置并插入。维基入口 第一个数当作有序数列。 实现如下: 过程解析:将要排序的数(索引为i)存储起来,向前查找合适位置j+1,将i-1到j+1的元素依次向后 移动一位,空出j+1,然后将之前存储的值放在这个位置。 这个方法写的不如维基上的简洁清晰,由于合适位置是j+1所以多出了对j==0的判断,但实际效率影响无差别。 建议比照维基和我写的排序,自行选择。 插入排序主要工作是在有序的数列中对要排序的数查找合适的位置,而查找里面经典的二分查找法正可以适用。 原理:通过二分查找法的方式找到一个位置索引。当要排序的数插入这个位置时,大于前一个数,小于后一个数。 实现如下: 过程解析:需要注意的是二分查找方法实现中high-low==1的时候mid==low,所以需要33行 mid-1<0即mid==0的判断,否则下行会索引越界。 快速排序是一种有效比较较多的高效排序。它包含了“分而治之”以及“哨兵”的思想。 原理:从数列中挑选一个数作为“哨兵”,使比它小的放在它的左侧,比它大的放在它的右侧。将要排序是数列递归地分割到 最小数列,每次都让分割出的数列符合“哨兵”的规则,自然就将数列变得有序。 维基入口 实现如下: 过程解析:取的哨兵是数列的第一个值,然后从第二个和末尾同时查找,左侧要显示的是小于哨兵的值, 所以要找到不小于的i,右侧要显示的是大于哨兵的值,所以要找到不大于的j。将找到的i和j的数交换, 这样可以减少交换次数。i>=j时,数列全部查找了一遍,而不符合条件j必然是在小的那一边,而哨兵 是第一个数,位置本应是小于自己的数。所以将哨兵与j交换,使符合“哨兵”的规则。 这个版本的缺点在于如果是有序数列排序的话,递归次数会很可怕的。 这是维基上的一个C#版本,我觉得很有意思。这个版本并没有严格符合“哨兵”的规则。但却将“分而治之” 以及“哨兵”思想融入其中,代码简洁。 实现如下: 过程解析:取的哨兵是数列中间的数。将数列分成两波,左侧小于等于哨兵,右侧大于等于哨兵。 也就是说,哨兵不一定处于两波数的中间。虽然哨兵不在中间,但不妨碍“哨兵”的思想的实现。所以 这个实现也可以达到快速排序的效果。但却造成了每次递归完成,要排序的数列数总和没有减少(除非i==j)。 实现如下: 过程解析:定义了一个变量Index,来跟踪哨兵的位置。发现哨兵最后在小于自己的那堆, 那就与j交换,否则与i交换。达到每次递归都能减少要排序的数列数总和的目的。 以上动图由“图斗罗”提供 通过标识提升冒泡排序
public static void BubbleSortImprovedWithFlag(IList<int> data)
{
bool flag;
for (int i = data.Count - 1; i > 0; i--)
{
flag = true;
for (int j = 0; j < i; j++)
{
if (data[j] > data[j + 1])
{
Swap(data, j, j + 1);
flag = false;
}
}
if (flag) break;
}
}
鸡尾酒排序(来回排序)
对冒泡排序进行更大的优化
public static void BubbleCocktailSort(IList<int> data)
{
bool flag;
int m = 0, n = 0;
for (int i = data.Count - 1; i > 0; i--)
{
flag = true;
if (i % 2 == 0)
{
for (int j = n; j < data.Count - 1 - m; j++)
{
if (data[j] > data[j + 1])
{
Swap(data, j, j + 1);
flag = false;
}
}
if (flag) break;
m++;
}
else
{
for (int k = data.Count - 1 - m; k > n; k--)
{
if (data[k] < data[k - 1])
{
Swap(data, k, k - 1);
flag = false;
}
}
if (flag) break;
n++;
}
}
}
插入排序
public static void InsertSort(IList<int> data)
{
int temp;
for (int i = 1; i < data.Count; i++)
{
temp = data[i];
for (int j = i - 1; j >= 0; j--)
{
if (data[j] > temp)
{
data[j + 1] = data[j];
if (j == 0)
{
data[0] = temp;
break;
}
}
else
{
data[j + 1] = temp;
break;
}
}
}
}
二分查找法优化插入排序
public static void InsertSortImprovedWithBinarySearch(IList<int> data)
{
int temp;
int tempIndex;
for (int i = 1; i < data.Count; i++)
{
temp = data[i];
tempIndex = BinarySearchForInsertSort(data, 0, i, i);
for (int j = i - 1; j >= tempIndex; j--)
{
data[j + 1] = data[j];
}
data[tempIndex] = temp;
}
}
public static int BinarySearchForInsertSort(IList<int> data, int low, int high, int key)
{
if (low >= data.Count - 1)
return data.Count - 1;
if (high <= 0)
return 0;
int mid = (low + high) / 2;
if (mid == key) return mid;
if (data[key] > data[mid])
{
if (data[key] < data[mid + 1])
return mid + 1;
return BinarySearchForInsertSort(data, mid + 1, high, key);
}
else // data[key] <= data[mid]
{
if (mid - 1 < 0) return 0;
if (data[key] > data[mid - 1])
return mid;
return BinarySearchForInsertSort(data, low, mid - 1, key);
}
}
快速排序
public static void QuickSortStrict(IList<int> data)
{
QuickSortStrict(data, 0, data.Count - 1);
}
public static void QuickSortStrict(IList<int> data, int low, int high)
{
if (low >= high) return;
int temp = data[low];
int i = low + 1, j = high;
while (true)
{
while (data[j] > temp) j--;
while (data[i] < temp && i < j) i++;
if (i >= j) break;
Swap(data, i, j);
i++; j--;
}
if (j != low)
Swap(data, low, j);
QuickSortStrict(data, j + 1, high);
QuickSortStrict(data, low, j - 1);
}
另一个版本
public static void QuickSortRelax(IList<int> data)
{
QuickSortRelax(data, 0, data.Count - 1);
}
public static void QuickSortRelax(IList<int> data, int low, int high)
{
if (low >= high) return;
int temp = data[(low + high) / 2];
int i = low - 1, j = high + 1;
while (true)
{
while (data[++i] < temp) ;
while (data[--j] > temp) ;
if (i >= j) break;
Swap(data, i, j);
}
QuickSortRelax(data, j + 1, high);
QuickSortRelax(data, low, i - 1);
}
针对这个版本的缺点,我进行了优化
public static void QuickSortRelaxImproved(IList<int> data)
{
QuickSortRelaxImproved(data, 0, data.Count - 1);
}
public static void QuickSortRelaxImproved(IList<int> data, int low, int high)
{
if (low >= high) return;
int temp = data[(low + high) / 2];
int i = low - 1, j = high + 1;
int index = (low + high) / 2;
while (true)
{
while (data[++i] < temp) ;
while (data[--j] > temp) ;
if (i >= j) break;
Swap(data, i, j);
if (i == index) index = j;
else if (j == index) index = i;
}
if (j == i)
{
QuickSortRelaxImproved(data, j + 1, high);
QuickSortRelaxImproved(data, low, i - 1);
}
else //i-j==1
{
if (index >= i)
{
if (index != i)
Swap(data, index, i);
QuickSortRelaxImproved(data, i + 1, high);
QuickSortRelaxImproved(data, low, i - 1);
}
else //index < i
{
if (index != j)
Swap(data, index, j);
QuickSortRelaxImproved(data, j + 1, high);
QuickSortRelaxImproved(data, low, j - 1);
}
}
}