"每一天都是值得被热爱的"
作者:Mylvzi
文章主要内容:常见排序算法实现
所谓排序,就是按照特定顺序重新排列序列的操作
当一个序列中存在相同的元素时 排序过后 他们出现的顺序和原来序列的顺序一致就说明此排序稳定;否则,就不稳定
- 内部排序是指对数据集合完全加载到内存中进行排序的过程。
- 这种排序方法适用于数据量较小,可以在计算机内存中容纳整个数据集的情况。
- 常见的内部排序算法包括冒泡排序、选择排序、插入排序、快速排序、归并排序等。
- 内部排序的优点是速度较快,因为所有数据都在内存中,不需要频繁的读取和写入操作。
- 外部排序是指对大规模数据集合进行排序的方法,数据量太大,无法一次性加载到内存中。
- 这种排序方法涉及将数据分割成适当大小的块,然后在内存中对这些块进行排序,最后将排序后的块写回磁盘或其他存储介质,并合并这些块以得到最终的排序结果。
- 外部排序常用于需要处理大量数据的场景,比如数据库系统中对大型表进行排序或外部存储设备上的数据排序。
- 常见的外部排序算法包括归并排序、多路归并排序等,这些算法允许对大规模数据进行高效排序,因为它们能够有效地利用磁盘I/O操作。
插入排序是一种非常简单的排序 比如在玩扑克牌时 在发牌阶段 我们每抽取一张牌 都要从后往前去比较大小 把抽取的牌插入到合适的位置
所以,插入排序就是将待排序的元素(抽取的牌)插入到一个已经有序的序列之中
/**
* 插入排序 在一个已经存在的序列中 插入到合适位置
* 时间复杂度:
* 最好情况:O(N)
* 最坏情况:O(N^2)
* 空间复杂度:
* O(1)
* 稳定性:是一个稳定的排序
* 所以对于一个有序的序列来说 插入排序就是最快的
*/
public static void insertSort(int[] arr) {
for (int i = 1; i < arr.length; i++) {
int tmp = arr[i];
int j = i-1;
for (; j >= 0; j--) {
// >tmp j向后挪动
if(arr[j] > tmp) {
arr[j+1] = arr[j];
}else {
// 要插入的元素已经是最大的了 不需要再去比较了
//arr[j+1] = tmp;
break;
}
}
// 跳出循环有两种情况 1.tmp是最小的需要插入到第一个元素 此时j=-1 结束条件是j不>=0了 2.else语句中的break;
arr[j+1] = tmp;
}
}
是根据插入排序的优点来进行优化的插入排序
我们知道,插入排序对于有序化高的序列来说速度是更快的,也就是说一个序列有序化越高,使用插入排序的时间复杂度就越低,速度就越快
所以,对于一大堆的数据来说,我们可以先进行“预排”,使其有序化程度越来越高,从而实现效率更高
设置gap 利用插入排序的思想 分组进行优化 组数不断降低 直到最后为1 最后一个进行排序时 序列的有序化程度已经很高 速度很快
希尔排序看似繁琐 实则提高了效率 虽然要进行多次插入排序 但时间优化了很多 主要原因在于以下几个方面:
1.分组会使得待排序的数据量减小 每次排序的数据量少 时间快
2.当gap = 1时,也就是要对整个序列进行排序 虽然数据量很大 但是有序化程度高 时间快
希尔排序的分析过
/**
* 希尔排序 优化的插入排序
* 先进行预排序 跳跃式进行分组 分的组数逐渐减少 直到组数为1
* 分组优化
* 时间复杂度:O(N^1.3)
* 空间复杂度:O(1)
* 稳定性:不稳定
*/
public static void shellSort(int[] arr) {
int gap = arr.length;
while (gap > 1) {
gap /= 2;
shell(arr,gap);
}
}
private static void shell(int[] arr,int gap) {
for (int i = gap; i < arr.length; i++) {
int tmp = arr[i];
int j = i-gap;
for (; j >= 0; j-= gap) {
// >tmp j向后挪动
if(arr[j] > tmp) {
arr[j+gap] = arr[j];
}else {
// 要插入的元素已经是最大的了 不需要再去比较了
//arr[j+1] = tmp;
break;
}
}
arr[j+gap] = tmp;
}
}
选择排序也是一个比较简单的排序 其核心思想在于每次都要选择一个最小的/最大的元素位于最左边
选择排序无论你的顺序如何 都要遍历整个数组去寻找最小值/最大值 所以对于初始顺序不敏感
public static void selectSort(int[] arr) {
for (int i = 0; i < arr.length; i++) {
int minIndex = i;
for (int j = i+1; j < arr.length; j++) {
if(arr[j] < arr[minIndex]) {
minIndex = j;
}
}
swap(arr,i,minIndex);
}
}
private static void swap(int[] arr,int i,int j) {
int tmp = arr[i];
arr[i] = arr[j];
arr[j] = tmp;
}
堆排 就是利用堆的特性进行排序的一种方式
思路:
1.看条件创建堆 升序--》大根堆 降序--》小根堆
2.交换首元素和末元素 向下调整
/**
* 堆排 从小到大
* 1.创建大根堆
* 2.交换 向下调整
*/
public static void heapSort(int[] arr) {
creatBigHeap(arr);
int end = arr.length-1;
while(end > 0) {
swap(arr,0,end);
shiftDown(arr,0,end);
end--;
}
}
private static void creatBigHeap(int[] arr) {
for (int parent = (arr.length-1-1)/2; parent >= 0; parent--) {
shiftDown(arr,parent,arr.length);
}
}
private static void shiftDown(int[] arr, int parent, int end) {
int child = 2*parent+1;
while (child < end) {
// 判断左右孩子谁是最大的
if(child+1 < end && arr[child] < arr[child+1]) {
child++;
}
if(arr[child] > arr[parent]) {
swap(arr,child,parent);
parent = child;
child = 2*parent+1;
}else {
break;
}
}
}
核心思路:分而治之
概念:任取待排序元素序列中的某元 素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有 元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
快速排序 本质上是一个递归的过程 有序时 会出现单叉树 此时时间复杂度最高 达到0(N^2)
/**
* 快速排序
*时间复杂度:O(N*logN); 每次分而治之需要遍历的数字都是N 最好情况是一颗完全二叉树 高度为logN 所以时间复杂度是N*logn
*
* 容易溢出 占用内存大
* 三种写法:hore法 挖坑法(推荐) 前后指针法
* 递归方法 最好的情况是一种完全二叉树
*/
public static void quickSort(int[] arr) {
quick(arr,0,arr.length-1);
}
private static void quick(int[] arr,int start,int end) {
if(start >= end) return;
if(end - start + 1 > 7) {
insertSortRange(arr,start,end);
return;
}
midOfThree(arr,start,end);
// 获得按照规则交换后的基准值的下标
int pivot = parttion(arr,start,end);
// 遍历左子树 分而治之
quick(arr,start,pivot-1);
// 遍历右子树 分而治之
quick(arr,pivot+1,end);
}
public static void insertSortRange(int[] arr,int begin,int end) {
for (int i = 1; i <= end; i++) {
int tmp = arr[i];
int j = i-1;
for (; j >= begin; j--) {
// >tmp j向后挪动
if(arr[j] > tmp) {
arr[j+1] = arr[j];
}else {
// 要插入的元素已经是最大的了 不需要再去比较了
//arr[j+1] = tmp;
break;
}
}
// 跳出循环有两种情况 1.tmp是最小的需要插入到第一个元素 此时j=-1 结束条件是j不>=0了 2.else语句中的break;
arr[j+1] = tmp;
}
}
private static void midOfThree(int[] arr, int left, int right) {
int mid = (left + right) / 2;
if(arr[left] > arr[right]) swap(arr,left,right);// 保证左边元素是较小值
if(arr[mid] > arr[right]) swap(arr,mid,right);// 保证中间元素是较小值
if(arr[mid] > arr[left]) swap(arr,mid,left);// 此时保证left下标的值是中间大小
}
private static int parttionHoare(int[] arr,int left,int right) {
int i = left;
// 每次都选取第一个元素为基准值
int key = arr[left];
// 遍历交换
// left 从左往右 找比Key大的
// right 从右往左 找比key小的
while (left < right) {
/**
* 为什么先走右边
* 先走right保证他们相遇时 一定是比key值小的数据
* 如果先走left 相遇时碰到的一定是比key大的 此时再交换 则key的左边存在比key大的数据了
*/
// 先从右边找
while (left < right && arr[right] >= key) { // 等号必须要取 万一两个都是6 会陷入死循环
right--;
}
// 此时right下标的元素比key小
while (left < right && arr[left] <= key) {
left++;
}
swap(arr,left,right);
}
// 使基准值位于中间(即左边都比key小 右边都比key大)
swap(arr,i,left);
return left;
}
/**
* 快排的优化
* 1.三数取中法:解决特殊情况 --》第一个数字是最小的 或者是最大的 减少了树的高度 开辟的空间更小
* 2.小区间内采用插入排序 减少递归的次数(但时间有可能会增加) 降低了内存的要求
*/
// 挖坑法
private static int parttion2(int[] arr,int left,int right) {
// 每次都选取第一个元素为基准值
int key = arr[left];
// 遍历交换
// left 从左往右 找比Key大的
// right 从右往左 找比key小的
while (left < right) {
// 先从右边找
while (left < right && arr[right] >= key) { // 等号必须要取 万一两个都是6 会陷入死循环
right--;
}
// 此时right下标的元素比key小
arr[left] = arr[right];
while (left < right && arr[left] <= key) {
left++;
}
arr[right] = arr[left];
}
// 使基准值位于中间(即左边都比key小 右边都比key大)
arr[left] = key;
return left;
}
private static int parttion(int[] arr,int left,int right) {
// 前后指针法
int prev = left;
int cur = left+1;
while (cur <= right) {
// 后面那个条件:cur和prev之间必须至少间隔一个元素
// 如果没有间隔元素 交换后又把比left大的移到了左边
if(arr[cur] < arr[left] && arr[++prev] != arr[cur]) {
swap(arr,cur,prev);
}
cur++;
}
// 遍历完整个数组了
swap(arr,left,prev);
return prev;
}
注意:
1.parttion一共有三种写法,推荐以挖坑法为先 前后指针或者Hoare法次之
2.为什么快速排序要先走right?因为这样能够保证left和right最后相遇的位置的元素是比key小的元素交换过后仍满足条件
// 快排的非递归写法
public static void quickSortNor(int[] arr) {
Stack stack = new Stack<>();
int left = 0;
int right = arr.length-1;
int pivot = parttion(arr,left,right);
// 如果等于 证明pivot左边只有一个数据 此时不需要再去排列了 下面的right同理
if(pivot-1 > left) {
stack.push(left);
stack.push(pivot-1);
}
if (pivot + 1 < right) {
stack.push(pivot+1);
stack.push(right);
}
while(!stack.isEmpty()) {
right = stack.pop();
left = stack.pop();
pivot = parttion(arr,left,right);
if(pivot-1 > left) {
stack.push(left);
stack.push(pivot-1);
}
if (pivot + 1 < right) {
stack.push(pivot+1);
stack.push(right);
}
}
}
/**
* 冒泡排序
* 时间复杂度:O(N^2) 最好(加了优化)O(N)
* 空间复杂度:O(1)
* 稳定性好
*/
public static void bubbleSort(int[] arr) {
for (int i = 0; i < arr.length; i++) {
boolean flg = false;
for (int j = 0; j < arr.length-1-i; j++) {
if(arr[j] > arr[j+1]) {
swap(arr,j,j+1);
flg = true;
}
}
if(!flg) {
return;
}
}
}
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使 子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:
分解左边 分解右边 合并
/**
* 归并排序:
* 时间复杂度:O(n*logN)
* 空间复杂度:O(N);
* 稳定
*
* 分解左边 分解右边 归并(合并两个有序数组)
*
* 稳定的排序:冒泡 插入 归并
*/
public static void mergeSort(int[] arr) {
mergeSortFunc(arr,0,arr.length-1);
}
private static void mergeSortFunc(int[] arr, int left, int right) {
if(left >= right) return;
int mid = (left+right) / 2;
mergeSortFunc(arr,left,mid);
mergeSortFunc(arr,mid+1,right);
merge(arr,left,mid,right);
}
private static void merge(int[] arr, int left, int mid, int right) {
// 这里边的思路相当于是 合并两个有序序列
int[] tmpArr = new int[right-left+1];
int k = 0;
// 分别定义两个需要合并的数组的首元素的下标
int s1 = left;
int s2 = mid+1;
// 遍历两个数组
while(s1 <= mid && s2 <= right) {
if(arr[s1] < arr[s2]) {
tmpArr[k++] = arr[s1++];
}else {
tmpArr[k++] = arr[s2++];
}
}
// 出循环证明有一个数组不为空
while(s1 <= mid) {
tmpArr[k++] = arr[s1++];
}
while (s2 <= right) {
tmpArr[k++] = arr[s2++];
}
// 将排序好的元素返回给原数组
for (int i = 0; i < tmpArr.length; i++) {
arr[i+left] = tmpArr[i];
}
}
// 归并排序的非递归写法
public static void mergeSortNor(int[] arr) {
int gap = 1;
while(gap < arr.length) {
for (int i = 0; i < arr.length; i+= 2*gap) {
int left = i;
int mid = i+gap-1;
int right = mid+gap;
if(mid >= arr.length) {
mid = arr.length-1;
}
if(right >= arr.length) {
right = arr.length-1;
}
merge(arr,left,mid,right);
}
gap *= 2;
}
}
设置一个计数数组 用于记录待排序数组中相应元素出现的次数 并按照下标排列 最后返回给原数组
/**
* 计数排序
* 时间复杂度:O(N+范围)
* 空间复杂度:O(范围)
* 适用于数据范围集中 数据量较小的情况
* 稳定性好
*/
public static void countSort(int[] arr) {
// 1.得到数组的最大值和最小值(数组的下标只能从0开始)
int minVal = arr[0];
int maxVal = arr[0];
for (int i = 0; i < arr.length; i++) {
if (arr[i] < minVal) {
minVal = arr[i];
}
if (arr[i] > maxVal) {
maxVal = arr[i];
}
}
//2.遍历arr 并在计数数组中存放对应的次数
int[] count = new int[maxVal - minVal + 1];
for (int i = 0; i < arr.length; i++) {
count[arr[i] - minVal]++;
}
//3.重新写入到原数组
int index = 0;
for (int i = 0; i < count.length; i++) {
while(count[i] > 0) {
arr[index] = i + minVal;
index++;
count[i]--;
}
}
}
选择排序无论你的顺序如何 都要遍历整个数组去寻找最小值/最大值 所以对于初始顺序不敏感