北柒kylin

关于『基本算法』:常见八大排序

序言

基本算法向你发起进攻，请注意防守。

排序，是非常重要的内容，一般来说，我们经常用到的其实是十大排序——

分类		名称	时间复杂度			空间复杂度	稳定性
分类		名称	平均情况	最好情况	最坏情况	辅助存储	稳定性
比较类	插入排序	直接插入排序	$O(n^2)$	$O(n)$	$O(n^2)$	$O(1)$	稳定
	插入排序	希尔排序	$O(n^{3\over 2})$	$O(n)$	$O(n^2)$	$O(1)$	不稳定
	选择排序	直接选择排序	$O(n^2)$	$O(n^2)$	$O(n^2)$	$O(1)$	不稳定
	选择排序	堆排序	$O(n\log n)$	$O(n\log n)$	$O(n\log n)$	$O(1)$	不稳定
	交换排序	冒泡排序	$O(n^2)$	$O(n)$	$O(n^2)$	$O(1)$	稳定
	交换排序	快速排序	$O(n\log n)$	$O(n\log n)$	$O(n^2)$	$O(\log n)$	不稳定
	归并排序		$O(n\log n)$	$O(n\log n)$	$O(n\log n)$	$O(n)$	稳定
非比较类	计数排序		$O(n+k)$	$O(n+k)$	$O(n+k)$	$O(max(n,k))$	稳定
	基数排序		$O(n*k)$	$O(n*k)$	$O(n*k)$	$O(n*k)$	稳定
	桶排序		$O(n+k)$	$O(n+k)$	$O(n^2)$	$O(n+k)$	稳定

注：在基数排序的复杂度中， $k$ 为位数，在另两个中为数据范围。

入学手册 ~

一、分类

1. 内部排序和外部排序

内部排序： 待排序记录存放在内存中进行的排序过程。
外部排序：待排序记录的数量很大，以致于内存不能一次容纳全部记录，所以在排序过程中需要对外存进行访问的排序过程。

2. 比较类排序和非比较排序

比较类排序： 通过比较来决定元素间的相对次序，由于其时间复杂度不能突破 $O(n\log n)$ ，因此也称为非线性时间比较类排序。
非比较类排序： 不通过比较来决定元素间的相对次序，它可以突破基于比较排序的时间下界，以线性时间运行，因此也称为线性时间非比较类排序。

二、复杂度分析，算法稳定性和自适应

稳定： 如果 $a$ 原本在 $b$ 前面，而 $a = b$ ，排序之后 $a$ 仍然在 $b$ 的前面。
不稳定： 如果 $a$ 原本在 $b$ 的前面，而 $a = b$ ，排序之后 $a$ 可能会出现在 $b$ 的后面。
时间复杂度： 对排序数据的总的操作次数。反映当数据规模变化时，操作次数呈现什么规律。
空间复杂度： 是指算法在计算机内执行时所需存储空间的度量，即个算法空间辅助空间单元的个数，与问题的规模没有关系。
自适应：当一些特殊数据出现时，算法与数据相适应，表现出不同特性与时间复杂度的过程。

三、名词解释：

$n$ ：数据规模。
$k$ ："桶"的个数。
算法复杂度：是用来衡量算法运行所需要的计算机资源（时间、空间）的量。

四、如何选择排序算法

1. 选择排序算法准则：

每种排序算法都各有优缺点。因此，在实用时需根据不同情况适当选用，甚至可以将多种方法结合起来使用。

2. 选择排序算法的依据:

影响排序的因素有很多，一般而言，需要考虑的因素有以下四点：

关键字数量大小；
数据规模大小；
关键字的结构及其分布情况；
对排序稳定性的要求。

3. 选择排序算法的方法:

>>> 设待排序元素的个数为 $n$

(1) 当 $n$ 较大，则应采用时间复杂度为 $O(n\log n)$ 的排序方法：快速排序，堆排序，归并排序。

快速排序：是目前基于比较的内部排序中被认为是最好的方法，当待排序的关键字是随机分布时，快速排序的平均时间最短，但不稳定。
堆排序：如果内存空间允许且要求稳定性的。
归并排序：如果内存空间允许且要求稳定性的。

(2) 当 $n$ 较大，内存空间允许，且要求稳定性 → 归并排序。

(3) 当 $n$ 较小，可采用直接插入或直接选择排序

直接插入排序：当元素分布有序，直接插入排序将大大减少比较次数和移动记录的次数。
直接选择排序：当元素分布有序，且不要求稳定性，可选择直接选择排序。

(4) 一般不使用或不直接使用传统的冒泡排序。

本篇 ~~被开刀的小白鼠~~ 题目：#2625. 常用排序法

一、插入排序 (Insertion Sort)

(一). 直接插入排序 (Straight Insertion Sort)

直接插入排序，是最简单一种的排序方法。

1.基本思想:

将一个记录插入到已经排好序的有序表中，从而一个新的、记录数增 $1$ 的有序表。
即：先将序列的第 $1$ 个记录看成是一个有序的子序列，然后从第 $2$ 个记录逐个进行插入，直至整个序列有序为止。

2. 讨论：

$\text{Part1}$ 插入排序的使用场景

虽然它是最坏时间复杂度为 $O(n^2)$ 基本排序算法之一，但插入排序常用于当数据近乎有序（因为它自适应，越接近有序越快）或问题规模很小时（因为它具有较低的代价）。
由于这些原因，且它也很稳定，所以插入排序常常被使用（当问题规模较小时），而像递归（当问题规模较大时）常使用更高代价的分治排序，例如归并排序或快速排序。

3. 特性

稳定的。
空间复杂度： $O (1)$ 。
时间复杂度： $O(n^2)$ （比较和交换）。
自适应：越接近有序越快（最好情况为常数阶 $O (n)$ ）。
非常低的代价。

4.动画演示:

5.函数原型

// Straight Insertion Sort
void Insert_sort(int *a, int n) {
	for (int i = 2; i <= n; i++) {
		t = a[i]; // 存储待排序元素  
		int j = i - 1; // 从前一个元素开始遍历
		while (t < a[j] && j) { // 查找在有序表的插入位置
			a[j + 1] = a[j];  // 元素后移  
			j--;
		}
		a[j + 1] = t; // 插入到正确位置  
	}
}

在其实现过程中使用双层循环，外层循环对除了第一个元素之外的所有元素，内层循环对当前元素前面有序表进行待插入位置查找，并进行移动。

(二). 希尔排序 (Shell Sort)

希尔排序是直接插入排序算法的一种更高效的改进版本，该方法因 D.L.Shell 于 $1959$ 年提出而得名。

1.基本思想:

希尔排序是基于插入排序的以下两点性质而提出改进方法的：

插入排序在对几乎已经排好序的数据操作时，可以达到线性排序的效率（效率高）；
但插入排序一般是低效的，因为插入排序每次只能将数据移动一位。

希尔排序是把记录按下标的一定增量（即步长）分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键字越来越多，当增量减至 $1$ 时，希尔排序退化为直接插入排序，保证最终数列已有序，整个文件恰被分成一组，算法便终止。

2. 讨论：

$\text{Part1}$ 希尔排序的诞生与本质

D.L.shell 于 $1959$ 年在以他名字命名的排序算法中实现了这一思想。算法先将要排序的一组数按某个增量 $d$ 分成若干组，每组中记录的下标相差 $d$ 。对每组中全部元素进行排序，然后再用一个较小的增量对它进行分组，在每组中再进行排序。当增量减到1时，整个要排序的数被分成一组，排序完成。
一般的初次取序列的一半为增量，以后每次减半，直到增量为 $1$ 。
该方法实质上是一种分组插入方法。比较相隔增量个位置的数，使得数移动时能跨过多个元素，则进行一次比较就可能消除多个元素交换。

$\text{Part2}$ 适用场景

由于其低代价、相对简单的实现、自适应特性和 $O(n^{3\over 2})$ 的时间复杂度，它适用于中等大小的排序数据规模。

$\text{Part3}$ 补充拓展

真 · 一个奇怪的小知识~

希尔排序的最坏情况时间复杂度其实取决于增量序列。
对于一个增量序列 {1, 4, 13, 40, 121…}，时间复杂度为 $^{3\over 2} )$ 。
对于其他增量序列，已知时间复杂度为 $^{4\over 3} )$ 甚至 $O(n\log n)$ 。
现目前，我们既不知道时间复杂度的严格上限，也不知道最佳增量序列。

3. 特性

不稳定。
空间复杂度： $O (1)$ 。
时间复杂度： $O(n^{\frac{3}{2}})$ 。
越接近有序越快（最好情况为 $O(n\log n)$ ）（有待再次考证）。

4.动画演示:

图解：

5.函数原型

// Shell Sort
void swap(int &x, int &y) { // swap函数简单版原型
	int t = x;
	x = y;
	y = t; 
}
void Shell_sort(int *a, int n) {
    int step; // 增量，即步长
    for (step = n / 2; step >= 1; step /= 2) { // 增量每次减半
        for (int i = step + 1; i <= n; i++) { // 从与第一位相隔增量个位置的数开始排序（即下标相隔一个step的位置）
            int tmp = i; // 分组排序指标
            while (tmp - step >= 1 && a[tmp - step] > a[tmp]) { // 比较相隔增量个位置的数的大小
                swap(a[tmp - step], a[tmp]);
                tmp -= step; // 指标向前挪移增量位
            }
        }
    }
}

真 · 一个奇怪的小知识~

因为希尔排序是基于插入排序而改进得到的，所以希尔排序继承了插入排序的自适应特性。这种适应并不那么引人注目，因为希尔排序需要为每个增量遍历一次数据，但这种特性很重要。

二、选择排序 $(Selection\ Sort)$

(一). 直接选择排序 $\text{(Straight Selection Sort)}$

直接选择排序，可以说是相当暴力的排序方法了。

1.基本思想:

在要排序的一组数中，选出最值与第一个位置数交换；然后在剩下的数当中再找最值与第二个位置数交换，依次类推，直到全部待排序的数据元素排完。

2. 讨论：

$\text{Part1}$ 永远不要使用选择排序

从这里提供的比较中，大家可能会得出结论：「永远不要使用选择排序」。
因为它不会以任何方式适应数据，不论数组是否有序都会执行原步骤。其时间复杂度始终是 $O(n^2)$ 。
然而，选择排序具有最小化交换次数的特性。在交换位置频率很高的应用程序中，选择排序可能是较好的算法。

3. 特性

不稳定。
空间复杂度： $O (1)$ 额外空间。
时间复杂度： $O(n^2)$ （比较）。
自适应：不适应。

4.动画演示:

5.函数原型

// Straight Select Sort
void swap(int &x, int &y) { // swap函数简单版原型
	int t = x;
	x = y;
	y = t; 
}
void Select_sort(int *a, int n) {
	int minn, min_i;
    for (int i = 1; i <= n; i++) {
    	minn = a[i];
    	min_i = i;
   		for (int j = i + 1; j <= n; j++) {
   			if (a[j] < minn) {
   				minn = a[j];	
   				min_i = j;
			}	
		}
		swap(a[i], a[min_i]);
    } 
}

注：直接选择排序思考非常好理解，但是效率不是很好，所以一般不建议使用。

(二). 堆排序 $\text{(Heap Sort)}$

堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点

1.基本思想:

将无序序列构建成一个堆，根据升序降序需求选择大顶堆或小顶堆。将堆顶元素与末尾元素交换，将最大元素"沉"到数组末端。重新调整结构，使其满足堆定义，然后继续交换堆顶元素与当前末尾元素，反复执行调整+交换步骤，直到整个序列有序

>>> 因此，实现堆排序需解决两个问题：

如何将 $n$ 个待排序的数建成堆；
输出堆顶元素后，怎样调整剩余 $(n - 1)$ 个元素，使其成为一个新堆。

2. 讨论：

$\text{Part1}$ 堆排的空间及时间复杂度

堆排序执行 $O(n\log n)$ 就地排序，但不稳定。此外，堆排序不要任何辅助数组，只需要一个辅助变量，所占空间是常数，与 $n$ 无关，所以空间复杂度为O(1)

$\text{Part2}$ 关于大小顶堆

真 · 一个奇怪的小知识~

堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点。

–>大顶堆：每个节点的值都大于或等于其子节点的值，在堆排序算法中用于升序排列；

–>小顶堆：每个节点的值都小于或等于其子节点的值，在堆排序算法中用于降序排列；

堆排序的基本思想是：将待排序序列构造成一个大顶堆，此时，整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换，此时末尾就为最大值。然后将剩余 $(n - 1)$ 个元素重新构造成一个堆，这样会得到n个元素的次小值。如此反复执行，便能得到一个有序序列了（升序排列）

3. 特性

不稳定
空间复杂度： $O (1)$ 额外空间
时间复杂度： $O(n\log n)$ (每次遍历 $n$ 遍元素，一共遍历 $\log n$ 次)
自适应：不是很适应

4.动画演示:（就这张让我悟了）

5.函数原型

// Heap Sort
void swap(int &x, int &y) {
	int t = x;
	x = y;
	y = t;
}
void sink(int *a, int i, int n) { // 把堆调整成大顶堆
    int l = 2 * i, r = l + 1, maxn;
    if (l > n) return ; // 没有左孩子时返回
    maxn = (r > n) ? l : (a[l] > a[r]) ? l : r; // 提取左右孩子的最大值位置
    if (a[i] >= a[maxn]) return ; // 符合大顶堆规则返回
    swap(a[i], a[maxn]); // 否则将最大值交换到父节点
    sink(a, maxn, n); // 向下调整
    return ;
}
void Heapsort(int *a, int n) {
    // heapify：初始堆
    for (int i = n / 2; i >= 1; i--) {
        sink(a, i, n); // 将数组放入堆顺序
    }
    // sortdown：将最大值“沉”到堆底
    for (int i = 1; i <= n; i++) { // 反复提取最大值并恢复堆顺序
        swap(a[1], a[n - i + 1]); // 将根结点（最大值）交换到末尾
        sink(a, 1, n - i); // 调整堆
    }
    return;
}

~~妈沫儿我悟了！！1~~

真 · 又一个奇怪的小知识~

Q：这个时间复杂度怎么推

A：1.构建初始堆复杂度： $O (n)$
2.交换重建堆复杂度： $O (n l o g n)$
3.整个过程的复杂度： $O = O (n) + O (n l o g n) = O (n l o g n)$

注：本章鸣谢敬之大佬提供的帮助

三、交换排序 $(Exchange\ Sort)$

(一). 冒泡排序 $\text{(Bubble Sort)}$

冒泡排序，是一种计算机科学领域的较简单的排序算法，也是在下学会的第一个算法

1.基本思想:

比较相邻的元素。如果第一个元素比第二个元素大（或小），就交换他们两个；
对每一对相邻元素做同样的工作，从开始第一对到结尾的最后一对。最后，尾元素应该会是最大（或最小）的数；
重复以上步骤，直到数组有序。

真 · 一个奇怪的小知识~

“冒泡排序” 这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端（升序或降序排列），就如同碳酸饮料中二氧化碳的气泡最终会上浮到顶端一样，故名“冒泡排序”。

2. 讨论：

$\text{Part1}$ 冒泡排序真的好慢！

「冒泡排序」是最慢的排序算法。其效率太低，是排序算法发展的初级阶段，实际应用中采用该算法的几率比较小。
冒泡排序具有许多与插入排序相同的属性，但开销略高。在几乎排序的数据的情况下，冒泡排序需要 $O (n)$ 时间，但每个数据需要访问 $2$ 次（而插入排序更像是每个数据每遍访问 $1$ 次），因为在冒泡排序中，每个元素需要和左右两个元素进行比较，而插入排序却是直接与目标元素比较。

3. 特性

稳定的
空间复杂度： $O (1)$ 额外空间
时间复杂度： $O(n^2)$ （比较和交换）
自适应：越接近有序越快（最好情况为常数阶 $O (n)$ ）

4.动画演示:

5.函数原型

// Bubble Sort
void swap(int &x, int &y) {
	int t = x;
	x = y;
	y = t;
}
void Bubble_sort(int *a, int n) {
	bool swapped = false;
    for (int i = 1; i < n; i++) {
    	for (int j = 1; j <= n - i; j++) {
    		if (a[j] > a[j + 1]) {
    			swap(a[j], a[j + 1]);
    			swapped = true;
			}
		}
		if (!swapped) break;
    } 
}

6.改进

由于冒泡排序实在是太效率低下~~（tm慢死）~~了，在这里为各位介绍一种改进 ~~（但其实也挺拉的）~~

鸡尾酒排序 $\text{(Cocktail Sort)}$

鸡尾酒排序，又称双向冒泡排序、鸡尾酒搅拌排序、搅拌排序、涟漪排序、来回排序或快乐小时排序，是冒泡排序的一种变形。

1.基本思想:

先找到最小的数字，放在第一位，再找到最大的数字放在最后一位。然后再找到第二小的数字放到第二位，再找到第二大的数字放到倒数第二位。以此类推，直到完成排序

算法描述如下：

先对数组从左到右进行升序的冒泡排序，最大的元素去到最右端
再对数组进行从右到左的降序的冒泡排序，最小的元素去到最左端
以此类推，持续的、依次的改变冒泡的方向，并不断缩小没有排序的数组范围，直到元素全体有序。

2. 讨论：

$\text{Part1}$

鸡尾酒排序是冒泡排序的一种改进，倒并未有本质的改变。与冒泡排序的时间复杂度和空间复杂度相近，整体的性能都比较差，比冒泡排序的效率稍微好一点，原因是冒泡排序只从一个方向进行比对(由低到高)，每次循环只移动一个项目。

3. 特性

稳定的
空间复杂度： $O (1)$ 额外空间（交换）
时间复杂度： $O(n^2)$
自适应：越接近有序越快（最好情况为常数阶 $O (n)$ ）

4.函数原型

// Cocktail Sort 
void swap(int &x, int &y) {
	int t = x;
	x = y;
	y = t;
}
void Cocktail_sort(int *a, int n){
    bool sorted = false; // 双向同时进行
    for(int i = 1; i <= n / 2; i++) {
        sorted = false;
        // 升序排列
        for(int j = i; j <= n - i; j++) {
            if(a[j] > a[j + 1]) {
                swap(a[j], a[j + 1]);
                sorted = true;
            }
        }
        // 降序排列
        for(int j = n - i; j >= i; j--) {
            if(a[j] < a[j - 1]) {
                swap(a[j], a[j - 1]);
                sorted = true;
            }
        }
        if(sorted == false) {
            break;
        }
    }
}

~~你学废了吗_(￣▽￣)~~

(二). 快速排序 $\text{(Quick Sort)}$

快速排序是对冒泡排序算法的一种改进。

1.基本思想:

快速排序算法通过多次比较和交换来实现排序，其排序流程（默认升序）如下：

选定一个基准值(这里默认左边）；
将大于或等于分界值的数据交换到数组右段，小于分界值的数据交换到数组的左段。此时，左边部分中各元素都小于或等于分界值，而右边部分中各元素都大于或等于分界值，中间交界的地方就把基准值放上去；
然后， 左边和右边的数据可以独立排序 。对于左侧和右侧的数组数据也做以上处理；
重复上述过程（可以看出，这是一个递归定义）。通过递归将左侧部分排好序后，再递归排好右侧部分的顺序。当左、右两个部分各数据排序完成后，整个数组的排序也就完成了。

2. 讨论：

$\text{Part1}$ 关于快排

快速排序是强大且代价低的（在阁下写对的前提下），当不需要稳定排序时，快速排序是最出色的通用排序之一

注：在快速排序中，3路分区版本更优，但2路分区（Hoare版本，快排发明者最初的写法）也是相当不错的

$\text{Part2}$ 关于时间复杂度

2路分区（Hoare版本）表现出较差的局部性，并且关键的是，当数列中**基准值为最大值（或最小值）**时，它可能会表现出 $O(n^2)$ 的时间复杂度

$\text{Part3}$ 关于空间复杂度

关于其空间复杂度，快速排序使用的空间的确是 $O (1)$ 的；而真正消耗空间的是递归调用，因为每次递归就要保持一些数据：最优的情况下空间复杂度为 $O(\log n)$ ，即每一次都平分数组的情况。最差的情况下空间复杂度为 $O (n)$ ，即退化为冒泡排序的情况

由于两个子排序都是递归执行的，因此在递归不平衡的最坏情况下，快速排序需要 $O (n)$ 额外的递归堆栈空间。这种情况发生概率极小 ~~(不亚于阁下在路上走着突然被“以刀劈狼首”，或者“数刀毙之”)~~，但可以通过先递归进行排序较小的子数组来避免；第二个子数组排序是尾递归调用，可以通过迭代来完成。通过这种优化，算法在最坏的情况下使用 $O (l o g n)$ 额外空间

综上，平均空间复杂度为 $O(\log n)$

3. 特性

不稳定
空间复杂度： $O(\log n)$ 额外空间
时间复杂度： $O(n\log n)$ (每次遍历 $n$ 遍元素，一共遍历 $\log n$ 次)
自适应：不适应

4.动画演示:

5.函数原型

// Quick Sort
void Quick_sort(int *a, int begin, int end) {
    if (begin >= end) { 
        return;
    }
    int key = a[begin];      
    int l = begin, r = end;  
    while (l != r) {    
        while (a[r] > key && l < r) {  // 选左端做基准值，所以 r 指针先走            	    r--;
        }
        // 注：a[r] > key不写等于，使得遇到和 key相等的数会停下来；最后
        // key和相遇点交换的时候，原来相等的数的相对位置会改变，所以快速排序是不稳定的。
        while (a[l] <= key && l < r) {  
	    l++;
        }
        if (l < r) {           
            swap(a[l], a[r]);  
        }
    }
    swap(a[begin], a[l]);  // 将基准值与相遇点的值交换，基准值来到排好序后的正确位置。
    // 此时 l(r) 所在位置左侧的所有数都比基准值小，右侧的所有数都比基准值大。
    quick_sort(a, begin, l - 1);  // 分段递归排序
    quick_sort(a, l + 1, end);
}

真 · 又一个奇怪的小知识~

“快速排序” 是递归的、速度最快的排序算法，但是在内存有限的情况下不是一个好的选择。而且，对于基本有序的数据序列排序，快速排序反而退化为冒泡排序，变得比较慢

快排是软件工业中最常见的常规排序法~~（我爱快排！！1）~~，其双向指针扫描和分区算法是核心，快排较于归并更重视子问题拆分

6.其他版本

快排版本还挺丰富的哈

(一). 挖坑法

1.基本思想:

先将选定的基准值 (一般取最左边) 直接取出，然后留下一个「坑」；
当右指针遇到小于基准值的数时，直接将该值放入「坑」中，而右指针指向的位置形成新的「坑位」，然后左指针遇到大于基准值的数时，将该值放入「坑」中，左指针指向的位置形成「坑位」；
重复该步骤，直到左右指针相遇；
最后将基准值放入「坑位」之中，之后以基准值为界限，递归排序基准值左右区间。

2. 讨论：

$\text{Part1}$

挖坑法其实和 2路分区本质上是一样的，稍稍优于 2路分区的是其可以避免交换，所以会快一些。

注：在实际测试中，2路分区总时间 $217\mathrm{ms}$ ，挖坑法 $193\mathrm{ms}$ 。

3. 特性

不稳定
空间复杂度： $O(\log n)$ 额外空间
时间复杂度： $O(n\log n)$ (每次遍历 $n$ 遍元素，一共遍历 $\log n$ 次)
自适应：不适应

4.动画演示:

5.函数原型

// 挖坑法
void Quick_sort(int *a, int l, int r) { // 挖坑法
    if (l >= r)
        return;
    int key = a[l]; 
    int i = l, j = r; 
    while (i < j) { 
        while (a[j] >= key && j > i) j--; 
        // 注：a[j] >= key一定要取等！！1
        // 否则当数据相等的较多时很浪费时间
        if (i < j) 
            a[i] = a[j];                   // 右指针成为新坑
        while (a[i] <= key && i < j) i++; 
        if (i < j)
            a[j] = a[i]; 
    }
    a[i] = key;  // 基准值放入该坑
    // 这个时候左指针走过的位置都是比 key 小的数，右指针走过的都是比 key 大的数，所以相遇点就是 key 该在的位置
    quick_sort(a, l, i - 1);  // 以基准值为界递归左右两段
    quick_sort(a, i + 1, r);
return;
}

(二). 快速排序三路分区 $\text{(Quick Sort 3-Way})$

1.基本思想:

从最左侧开始，向右找到一个不小于基准值的数；
从最右侧开始，向左找到一个不大于基准值的数；
交换两个位置上的数；
如果左元素和基准值相等，则交换到左端；
如果右元素和基准值相等，则交换到右端；
重复以上步骤，直到两指针相遇；
将基准值交换到两指针相遇处，注意交换完成后数组最左侧不是基准值；
将数组中左端等于基准值的数交换到中间；
将数组中右端等于基准值的数交换到中间；
继续递归左右子列。

2. 讨论：

$\text{Part1}$ 关于三路快排的产生

快排是二路划分的算法。如果待排序列中重复元素过多，也会大大影响排序的性能。这时候，如果采用三路划分，则会很好的避免这个问题。
如果一个待排序列重复元素过多，我们就选择一个基准值，设为 key，那么数列可以分为三部分：小于 key，等于 key，大于 key。
等于 key 的部分就无需再参与后续的递归调用了，速度自然就大大提升了。

$\text{Part2}$ 关于三路快排的特性

与标准的 $2$ 路分区版本相比，快速排序的 $3$ 路分区变体的开销略高。两者都具有相同的最佳、典型和最坏情况的时间界限，但此版本在待排序列中元素相同较多的情况下具有高度的适应性
在 $2009$ 年，俄罗斯人 Vladimir Yaroslavskiy 发现了一种双枢轴 $3$ 路分区变体——Dual-Pivot QuickSort，它在理论上和实践上都优于单枢轴 $3$ 路分区方法。

3. 特性

不稳定。
空间复杂度： $O(\log n)$ 额外空间。
时间复杂度： $O(n\log n)$ (每次遍历 $n$ 遍元素，一共遍历 $\log n$ 次)。
自适应：不同元素越少越快（当只有唯一元素不同时，时间复杂度 $O (n)$ ）

4.动画演示:

5.函数原型

// Quick Sort 3-Way
void Quick3(int *a, int begin, int end) {
	if (begin >= end) { 
		return ;
	}
	int key = a[begin]; 
	int i = begin, j = end + 1, p = begin, q = end + 1; // i、j为指针，p、q用于将与 key 相同的值交换到数组两端
	while (i < j) {
		while (i < j && a[--j] > key) ; //自左向右扫描第一个不大于基准值的数
		while (i < j && a[++i] < key) ; //自右向左扫描第一个不小于基准值的数
		if (i < j) {
			swap(a[i], a[j]); //比基准值小的数放左边，比 基准值大的数放右边 
			if (a[i] == key) swap(a[i], a[++p]); //如果左元素和基准值相等，则交换到左端
			if (a[j] == key) swap(a[j], a[--q]); //如果右元素和基准值相等，则交换到右端
		}
	}
	swap(a[i], a[begin]); //将基准值交换到两指针相遇处,注意交换完成后数组最左侧不是基准值
	i--, j++; //将两指针分别放置在基准值的左右两侧，准备交换  
	for (int k = begin + 1; k <= p; k++, i--) swap(a[i], a[k]);  //将数组中左端等于基准值的数交换到中间 
    for (int k = end; k >= q; k--, j++) swap(a[j], a[k]);  //将数组中右端等于基准值的数交换到中间 
    //继续递归左右子列 
	Quick3(a, begin, i); 
	Quick3(a, j, end);
}

(三). 前后指针法

1. 基本思想

先选一个基准值 key（本次演示取最左边为基准值，这里选右边的话操作略有不同）
prev 放在最左边，cur 在 prev 下一个位置
cur 往右找比 key 小的值，找到后让 prev 后移一位，并交换 prev 和 cur 所指位置上的数
重复以上步骤，直到 cur 超出最右边，把基准值和 prev 所指位置上的数交换

2. 讨论：

$\text{Part1}$ 代码易错点

从排序过程来看，prev 把比基准值大的数都拉到了右边，cur 把比基准值小的数都推到了左边

这里注意：当 cur 找到比基准值小的数后， prev 要往后移一位再交换，交换后 cur 也要向后移一位

有意思的是，交换后如果没有让 cur 后移一位，程序并不会死循环，因为每次交换prev 都会向后移，prev 会超过 cur 并越界让随机值和 cur 交换，使得 cur 又向后移动，当 cur 超出右边界循环就结束了（可以亲身体会一下）。

3. 特性

不稳定
空间复杂度： $O(\log n)$ 额外空间
时间复杂度： $O(n\log n)$ (每次遍历 $n$ 遍元素，一共遍历 $\log n$ 次)
自适应：不适应

4.动画演示:

5.函数原型

// 前后指针法
void Quicksort_zhizhen(int *a, int begin, int end) {
	if (begin >= end) { 
		return ;
	}
	int key = a[begin]; 
	int prev = begin, cur = begin + 1; 
	// prev:英文单词previous缩写
	// cur:英文单词current缩写
	while (cur <= end) { 
		while (a[cur] >= key && cur <= end) cur++;
		if (cur <= end && a[cur] < key) {
			prev++;
			swap(a[cur], a[prev]);
			cur++; // 一定要后移 
		}
	}
	swap(a[begin], a[prev]);
	Quicksort_zhizhen(a, begin, prev - 1); 
	Quicksort_zhizhen(a, prev + 1, end);
}

6. 效率对比

耗时测试：20组数据比较共同用时 $\le 100000)$

快速排序（Hoare版本（快排发明者最初的写法），2路分区）： $217\mathrm{ms}$ ；
挖坑法： $193\mathrm{ms}$ ；
快速排序（3路分区）： $217\mathrm{ms}$ ；
前后指针法： $201\mathrm{ms}$ 。

挖坑法在这组数据中表现出人意料，居然是最快的，而且还在 $200\mathrm{ms}$ 以内（（震惊中。。。
3路分区在数据重复较多的时候才会大放异彩，但在此处的数据中，并没有大量重复数据，所以时间和 2路分区一样（想康康 3路分区 nb之处的童鞋可以找一些重复元素很多的数据 try try）；
前后指针法作为一种比较新颖的算法表现还是不错，差一点点就挺进 200ms 以内了。

真 · 一个奇怪的小知识~

“快速排序” 无法解决的缺陷：当数据全部相同，或少量不同数据交替出现，这两种情况下快排的效率很低，即使是 3路分区也没办法解决

四、归并排序 $\text{(Merge Sort)}$

归并排序是建立在归并操作上的一种有效，稳定的排序算法

1.基本思想:

将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并

※ 主要思想：分治法

在计算机科学中，分治法是一种很重要的算法。字面上的解释是 “分而治之” ，就是 把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题 分成更小的子问题 ，直到最后子问题可以简单的直接求解，原问题的 解即子问题的解的合并 。这个技巧是很多高效算法的基础

敲黑板 · 一个奇怪的小知识~

分治法的精髓：

分 --> 将问题分解为规模更小的子问题

治 --> 将这些规模更小的子问题逐个击破

合 --> 将已解决的子问题合并，最终得出“母”问题的解

2. 讨论：

$\text{Part1}$ 归并的优点

归并排序速度仅次于快速排序，一般用于对总体无序，但是各子项相对有序的数列

如果不考虑使用 $O (n)$ 额外空间，那么归并排序是一个很好的选择：它实现简单，并且是唯一稳定的 $O(n\log n)$ 排序算法。请注意，在对链表进行排序时，归并排序只需要 $O(\log n)$ 额外空间。

$\text{Part2}$ 使用场所

归并排序是多种情况下的首选算法：1.需要稳定排序；2.对链表进行排序；3.随机访问比顺序访问成本高得多时。

$\text{Part3}$

真 · 一个奇怪的小知识~

数据是要存在数组里面的，所以要开和数据量一样大的数组，即空间复杂度（使用数组）为 $O (n)$

注：递归的时间复杂度看的是递归深度，因为同一层递归是可以使用同一块空间的（阁下可以整几道题 try try）

3. 特性

稳定的
空间复杂度： $O (n)$ 辅助数组的额外空间 / $O(\log n)$ 辅助链表的额外空间（用于递归）
时间复杂度： $O(n\log n)$ （每次都需要给 $n$ 个元素排序，排序的过程需要 $\log n$ ）
自适应：不适应(无论原始数组是否是有序的，都要递归分隔并向上归并排序，所以时间复杂度始终是 $O(n\log n)$ )
不需要随机访问数据

4.动画演示:

5.函数原型（似乎不太标准）

// Merge Sort
void Merge(int *a, int l, int mid, int r) {
	if (l >= r) return ; // 分到空集或只有一个元素，子问题为有序
	int i = l, j = mid + 1; // 定义左右子段的头指针
	int res[100005], len = 1; // 临时数组储存答案
	for (len; i <= mid && j <= r; len++) {
		if (a[i] <= a[j]) { // 若此处不取等则为不稳定排序
			res[len] = a[i++];	
		} else {
			res[len] = a[j++];
		} 
	}
	while (i <= mid) res[len++] = a[i++]; // 把剩余的元素顺次加在尾部
	while (j <= r) res[len++] = a[j++];
	len = 1;
	while (l <= r) a[l++] = res[len++]; // 把已经有序的子问题放回原数组中
	return ;
}
void Mergesort(int *a, int l, int r) {
	int mid;
	if (l < r) {
		mid = (l + r) >> 1;
		Mergesort(a, l, mid); // 分成子问题
		Mergesort(a, mid + 1, r);
		Merge(a, l, mid, r); // 把子问题的解合并起来
	}
	return ; 
}

真 · 一个奇怪的小知识~

“归并排序” 相较于 “快速排序” 而言，归并更重视子问题的解的合并。归并排序其实是用空间换时间，它固然快，但所需付出的空间代价是较为昂贵的

五、计数排序 $\text{(Counting Sort)}$

计数排序是一个非基于比较的排序算法。

1.如果要排序的项目是小范围的整数，我们可以计算每个整数（在这个小范围内）的出现频率，然后通过循环该小范围来按排序顺序输出项目

2.计数排序又称为鸽巢原理，是对哈希直接定址法的变形应用：统计相同元素出现次数，根据统计的结果将序列回收到原来的序列中

1.基本思想:

计数排序的基本思想是对于给定的输入序列中的每一个元素x，确定该序列中值小于 $x$ 的元素的个数（此处并非比较各元素的大小，而是通过对元素值的计数和计数值的累加来确定）。一旦有了这个信息，就可以将x直接存放到最终的输出序列的正确位置上

2. 讨论：

$\text{Part1}$ 计数的优势

计数排序的优势在于在对一定范围内的整数排序时，它的复杂度为Ο(n+k)（其中k是整数的范围），快于任何比较排序算法

当然这是一种牺牲空间换取时间的做法，而且当 $O(k)>O(n\log n)$ 的时候其效率反而不如基于比较的排序（基于比较的排序的时间复杂度在理论上的下限是 $O(n\log n)$ , 如归并排序，堆排序）

$\text{Part2}$ 非比较的稳定排序

我们看到，计数排序算法没有用到元素间的比较，它利用元素的实际值来确定它们在输出数组中的位置。因此，计数排序算法不是一个基于比较的排序算法，从而它的计算时间下界不再是 $O (n l o g n)$ 。另一方面，计数排序算法之所以能取得线性计算时间的上界是因为对元素的取值范围作了一定限制，即 $k = O (n)$ 。如果 $k=n^2,n^3,..$ ，就得不到线性时间的上界。经计数排序，输出序列中值相同的元素之间的相对次序与他们在输入序列中的相对次序相同，换句话说，计数排序算法是一个稳定的排序算法

$\text{Part3}$

真 · 一个奇怪的小知识~

计数排序在数据范围集中时，效率很高，但是适用范围及场景有限，比如当数组最大和最小差值过大时，浮点数等等，但可以处理负数和字符

3. 特性

稳定的
空间复杂度： $O (ma x (n, k))$
时间复杂度： $O (n + k)$
自适应：不适应
局限性

4.动画演示:

5.函数原型

// Counting Sort
void Countingsort(int* a, int n) {
	int max = a[1], min = a[1];
	for (int i = 1; i <= n; i++) {
		if (a[i] > max) { // 寻找最大最小值，以方便定义计数数组范围
			max = a[i];
		}
		if (a[i] < min) {
			min = a[i];
		}
	}
	int range = max - min + 1; // 定义数组范围
	int count[range] = {}; // 创建关键值（计数）数组
	for (int i = 1; i <= n; i++) { // 遍历数组中的每个元素
		count[a[i] - min]++; // 以最小值为基准确定位置，相应的计数器增加1
	}
	int j = 0;
	for (int i = 0; i < range; i++) {
		while (count[i]--) { // 当计数为非零数时循环
			a[++j] = i + min; // 此时在对应位置，大小为差值加最小值（基准值），将计数减1
		}
	}
    return ;
}

真 · 一个奇怪的小知识~

在最大值和最小值相差较小的情况下，计数排序的效率会达到排序的天花板 $O (n)$

六、基数排序 $\text{(Radix Sort)}$

基数排序是一种分配式排序

1.如果要排序的项目是整数，范围大但位数少，我们可以合并计数排序用基数排序的想法来实现线性时间复杂度

2.基数排序又称“桶子法”或 $bin sor t$ 。
顾名思义，它是透过键值的部份资讯，将要排序的元素分配至某些“桶”中，藉以达到排序的作用。
在某些时候，基数排序法的效率高于其它的稳定性排序法

1.基本思想:

基数排序是一种非比较型整数排序算法，其原理是将整数按位数切割成不同的数字，然后按每个位数分别比较。由于整数也可以表达字符串，所以基数排序也可以适用于字符

基数排序就像在人工比较数的大小，是按位来对比的

将所有待排序的数统一为相同的数位长度，数位较短的数前面补零，然后从低位到高位按位比较，位数字小的排在前面，大的排在后面，这样当比较第 $n$ 位时前 $n - 1$ 位都是有序的，如此循环的比较，直到最高位比较完成，整个序列就是有序的了

2. 讨论：

$\text{Part1}$ 关于基数排序

基数排序适用于规模很大的情况，但是只适用于整数的排序，如果对浮点数进行基数排序，则必须明确浮点数的存储格式，然后通过某种方式将其映射到整数上，最后再映射回去，过程复杂

基数排序过程无须比较关键字，而是通过“分配”和“收集”过程来实现排序。它们的时间复杂度可达到线性阶： $O (n)$

基数是按照优先级顺序排序。因为它基于分别排序，且分别收集，所以是稳定的

$\text{Part2}$ 如何按关键字存储

基数排序一般借助桶式排序，每次按第 $n$ 位排序时，采用桶式排序。对于如何安排每次落入同一个桶中的数据有两种安排方法：

1. 顺序存储：每次使用桶式排序，放入r个桶中，相同时增加计数

2. 链式存储：每个桶通过一个静态队列来跟踪

$\text{Part3}$

敲黑板 · 一个奇怪的小知识~

设 $n$ 个元素的待排序列包含 $d$ 个关键码 ${k1，k2，…，kd\}$ ，则称序列对关键码 ${k1，k2，…，kd\}$ 有序是指：对于序列中任两个记录 $r [i]$ 和 $r [j] (1 \leq i \leq j \leq n)$ 都满足下列有序关系：

$({k^1_i},{k^2_i},\cdots ,{k^d_i}) < ({k^1_j},{k^2_j},\cdots ,{k^d_j})$

其中 $k 1$ 称为最主位关键码， $k d$ 称为最次位关键码

※ 两种多关键码排序方法：

多关键码排序按照从最主位关键码到最次位关键码或从最次位到最主位关键码的顺序逐次排序，分两种方法：

最高位优先法 $(Most\ Significant\ Digit\ first)$ ，简称 MSD 法：

1）先按 $k 1$ 排序分组，将序列分成若干子序列，同一组序列的记录中，关键码 $k 1$ 相等

2）再对各组按 $k 2$ 排序分成子组，之后，对后面的关键码继续这样的排序分组，直到按最次位关键码 $k d$ 对各子组排序后

3）再将各组连接起来，便得到一个有序序列

最低位优先法 $(Least\ Significant\ Digit\ first)$ ，简称 LSD 法：

1）先从 $k d$ 开始排序，再对 $k d - 1$ 进行排序，依次重复，直到按 $k 1$ 排序分组分成最小的子序列

2) 最后将各个子序列连接起来，便可得到一个有序的序列

3. 特性

稳定的
空间复杂度： $O (n * k)$
时间复杂度： $O (n * k)$
自适应：不适应

4.动画演示:

5.函数原型

// Radix Sort - LSD法
void Radixsort(int* a, int n) {
	const int base = 10 + 5;
	struct node { // 这里是链式存储
		queue<int> q; // 每个桶通过一个静态队列来跟踪
	} bucket[base]; // 创建10个桶（队列）分别给每个数位（0~9）
	int maxn = 0, exp = 1;
	for (int i = 1; i <= n; i++) { 
		maxn = max(a[i], maxn); // 获取最大数以便找到最高位
	}
	while (maxn / exp != 0) { // 从最低位开始到最高位遍历
		for (int i = 1; i <= n; i++) { // 遍历数列中的每个元素
			bucket[a[i] / exp % 10].q.push(a[i]); // 将元素一直相应的桶中
		}
		int j = 1;
		for (int i = 0; i <= 9; i++) { // 从最低位开始
			while (!bucket[i].q.empty()) { // 当桶不是空的
				a[j++] = bucket[i].q.front(); // 将元素恢复至数列中
				bucket[i].q.pop();
			}
		}
		exp *= 10; // 下一位
	}
    return ;
}

真 · 一个奇怪的小知识~

基数排序可以说是扩展了的桶式排序，比如当待排序列在一个很大的范围内，比如0到999999，此时用桶式排序是很浪费空间的。

而基数排序把每个排序码拆成由d个排序码，比如任何一个6位数（不满六位前面补0）拆成6个排序码，分别是个位的、，十位的、，百位……排序时，分6次完成

七、桶排序 $\text{(Bucket Sort)}$

桶排序是鸽巢排序的一种归纳结果

桶排序又称“箱排序”。
是鸽巢排序的一种归纳结果。当要被排序的数组内的数值是均匀分配的时候，桶排序使用线性时间 $O (n)$ 。但桶排序并不是比较排序，他不受到 $\log n)$ 下限的影响。

1.基本思想:

桶排序是计数排序的扩展版本，计数排序可以看成每个桶只存储相同元素，而桶排序每个桶存储一定范围的元素，通过映射函数，将待排序数组中的元素映射到各个对应的桶中，对每个桶中的元素进行排序，最后将非空桶中的元素逐个放入原序列中。

根据待排序集合中最大元素和最小元素的差值范围和映射规则，确定申请的桶个数；

遍历待排序集合，将每一个元素移动到对应的桶中；
对每一个桶中元素进行排序，并移动到已排序集合中。

~~突然发现桶排不简单~~

2. 讨论：

$\text{Part1}$ 关于鸽巢排序

敲黑板 · 一个奇怪的小知识~

鸽巢排序（Pigeonhole sort），也被称作基数分类，是一种时间复杂度为O(n)（大O符号）且在不可避免遍历每一个元素并且排序的情况下效率最好的一种排序算法。但它只有在差值（或者可被映射在差值）很小的范围内的数值排序的情况下实用。
当涉及到多个不相等的元素，且将这些元素放在同一个"鸽巢"的时候，算法的效率会有所降低。为了简便和保持鸽巢排序在适应不同的情况，比如两个在同一个存储桶中结束的元素必然相等
我们一般很少使用鸽巢排序，因为它很少可以在灵活性，简便性，尤是速度上超过其他排序算法。事实上，桶排序较鸽巢排序更加的实用。

$\text{Part2}$ 桶排的代价

桶排序利用函数的映射关系，减少了几乎所有的比较工作。实际上，桶排序的f(k)值的计算，其作用就相当于快排中划分，已经把大量数据分割成了基本有序的数据块(桶)。然后只需要对桶中的少量数据做先进的比较排序即可

>>> 对 $n$ 个关键字进行桶排序的时间复杂度分为两个部分：
(1) 循环计算每个关键字的桶映射函数，这个时间复杂度是 $O (n)$
(2) 利用先进的比较排序算法对每个桶内的所有数据进行排序，其时间复杂度为 $\sum O(ni\log ni)$ 。其中 $ni$ 为第 $i$ 个桶的数据量

很显然，第(2)部分是桶排序性能好坏的决定因素。尽量减少桶内数据的数量是提高效率的唯一办法(因为基于比较排序的最好平均时间复杂度只能达到 $O(n\log n)$ 了)

>>> 因此，我们需要尽量做到下面两点：
(1) 映射函数 $f (k)$ 能够将 $n$ 个数据平均的分配到 $m$ 个桶中，这样每个桶就有 $[n / m]$ 个数据量。
(2) 尽量的增大桶的数量。极限情况下每个桶只能得到一个数据，这样就完全避开了桶内数据的“比较”排序操作。当然，做到这一点很不容易，数据量巨大的情况下， $f (k)$ 函数会使得桶集合的数量巨大，空间浪费严重。

(时间还是空间？这是一个问题)

对于 $n$ 个待排数据， $m$ 个桶，平均每个桶 $[n / m]$ 个数据的桶排序平均时间复杂度为：
$O(n)+O(m*(n/m)*\log(n/m))=O(n+n*(\log n-\log m))=O(n+n\log n-n\log m)$

当 $n = m$ 时，即极限情况下每个桶只有一个数据时。桶排序的最好效率能够达到 $O (n)$ 。
总结：桶排序的平均时间复杂度为线性的 $O (n + c)$ ，其中 $c=n(\log n-\log m)$ 。如果相对于同样的 $n$ ，桶数量 $m$ 越大，其效率越高，最好的时间复杂度达到 $O (n)$ 。当然桶排序的空间复杂度为 $O (n + m)$ ，如果输入数据非常庞大，而桶的数量也非常多，则空间代价无疑是昂贵的。此外，桶排序是稳定的。

3. 特性

稳定的
空间复杂度： $O (n + k)$
时间复杂度： $O (n + k)$
自适应：不适应

4.图解:

5.函数原型（似乎也不太标准）

(1) 低配版

// Bucket Sort 01
void Bucketsort01(int *a, int n) {
	// 桶的数量因题而异
	int bucket[100005], maxn = INT_MIN, minn = INT_MAX; 
	for (int i = 1; i <= n; i++) {
		bucket[a[i]]++; // 这里每个桶的范围都是1，所以直接对应桶加一
		minn = min(a[i], minn); // 找最大最小值边界
		maxn = max(a[i], maxn);
	} 
	for (int i = minn; i <= maxn; i++) {
		while (bucket[i] > 0) { // 桶不为空
			printf("%d ", i); // 输出该桶代表的数
			bucket[i]--; // 桶内元素减少一
		}
	}
	return ;
}

(2) 正常版

// Bucket Sort
void Sort(queue<int> &q, int n) { // 将队列排至有序
	int ans[n + 5]; // 定义辅助数组
	for (int i = 1; i <= n; i++) { // 将队列元素放入数组
		ans[i] = q.front();
		q.pop();
	} 
	sort(ans + 1, ans + n + 1); // 将数组排至有序
	for (int i = 1; i <= n; i++) { // 将有序的数组重新放回队列
		q.push(ans[i]);
	} 
	return ;
}
void Bucketsort(int *a, int n) {
	int maxn = INT_MIN, minn = INT_MAX;
	for (int i = 1; i <= n; i++) { // 计算最大值与最小值
		maxn = max(a[i], maxn);
		minn = min(a[i], minn);
	}
	int bucketsum = (maxn - minn) / n + 1; // 计算桶的数量
	queue<int> q[bucketsum];
	for (int i = 1; i <= n; i++) { // 将每个元素放入桶
		int num = (a[i] - minn) / n;
		q[num].push(a[i]);
	}
	int cnt = 0;
	for (int i = 0; i < bucketsum; i++) {
		Sort(q[i], q[i].size()); // 对每个桶进行排序
		while (!q[i].empty()) { // 将桶中的元素赋值到原序列
			a[++cnt] = q[i].front();
			q[i].pop();
		}
	}
	return ;
}

（（鸣谢乐府提供的 Idea

真 · 一个奇怪的小知识~

桶排序的稳定性取决于桶内排序使用的算法。当数据跨度过大时，这个空间消耗就会很大；如果数值的范围特别大，那么对空间消耗的代价肯定也是不切实际的，所以这个算法还有一定的局限性。

$\text{Question and Answer}$

$\text{Q1:}$ 如何评价一个排序算法?

$\text{A:}$ 对于一个排序算法的评价，一般有以下几个标准：

时间复杂度：最好、最坏、平均
通常对于基于比较的排序算法，最好就是顺序排列时，最坏就是逆序排列时，平均就是随机排列时。因为不同的算法在不同的情形下表现可能大不相同，因为我们需要根据实际情况，选择最佳算法

>>> 时间复杂度的系数，常数，低阶

当用 $B i g - O$ 分析的时候，通常忽略这些细节，但是 $B i g - O$ 针对的是数据规模很大的情况下的增长趋势。而排序算法，很多情况下是限定规模的，比如 10， 1000， 100万，因此这些被忽略的项需要加上才能比较不同算法的优劣。

比较次数和交换（或移动）的次数

尤其是对于基于比较的排序算法，核心就两步，比较–交换，统计次数尤为重要。
算法的内存消耗

即空间复杂度，如果是原地排序（sorted in place），空间复杂度就是 $O (1)$
算法的稳定性
当排序后需要保持相同元素相对位置不发生改变时，使用稳定排序。没有要求时可自由使用

$\text{Q2:}$ 按时间复杂度、稳定性把排序算法分类怎么分?

$\text{A:}$

关于时间复杂度

平方阶 $O(n^2)$ ：直接插入，直接选择，冒泡排序
线性对数阶 $O(n\log n)$ ：快速排序，堆排序，归并排序
$O(n^§)$ ( § 是介于 0 和 1 之间的常数 )：希尔排序
线性阶 $O (n)$ 排序：计数排序，基数排序，桶排序

关于稳定性

稳定排序：冒泡排序，插入排序，归并排序，计数排序，基数排序，桶排序
不稳定排序：选择排序，快速排序，希尔排序，堆排序

$\text{Q3:}$ 时间复杂度怎么增长，它们有什么区别?

$\text{A:}$

时间复杂度函数O(n)的增长情况：

图1

图2

$\text{Q4:}$ 这些算法有什么差异?

$\text{A:}$

直接插入排序：是对冒泡排序的改进，比冒泡排序快，但是只适用于数据量较小 (1000以下) 的排序
希尔排序：比较简单，适用于小数据量（5000以下）的排序，比直接插入排序、冒泡排序快，因此，希尔排序适用于小数据量的、排序速度要求不高的排序
直接选择排序：经常使用它内部的循环方式来找最大值和最小值。和冒泡排序算法一样，适用于数据量较小的场合，而且是排序算法发展的初级阶段，在实际应用中采用的几率较小
堆排序：用到了二叉堆数据结构，是继续掌握树结构的起手式，比较适用于数据量达到百万及其以上的排序，在这种情况下，使用递归设计的快速排序和归并排序可能会发生堆栈溢出的现象（蒟蒻摸鱼人曾遭过）
冒泡排序：效率太低，通过冒泡可以掌握swap。是最慢的排序算法，是排序算法发展的初级阶段，实际应用中采用该算法的几率比较小
快速排序：快排重视子问题拆分，是速度最快的递归排序算法，但是在数据基本有序的情况下不是一个好的选择，快速排序反而变得比较慢
归并排序：可以求逆序对数，比堆排序要快，但是需要的存储空间增加一倍，归并重视子问题的解的合并
计数排序：可以说是最快的，但计数排序的适用范围是：序列的关键字比较集中，已知边界，且边界较小
基数排序：适用于规模数据规模很大的场合，但是只适用于整数的排序，如果对浮点数进行基数排序，则必须明确浮点数的存储格式，然后通过某种方式将其映射到整数上，最后再映射回去，过程复杂
桶排序：用它解决问题必须注意序列的值是否均匀地分布在桶中。如果不均匀，极端情况下，全部元素在一个桶内，还是会退化

$\text{Q5:}$ 想看实际对比

$\text{A:}$ 好嘞

测试题目：#2625. 常用排序法

名称	状态	分数	总用时	内存
直接插入排序	TLE	95	1373ms	688K
希尔排序	AC	100	306ms	680K
直接选择排序	TLE	95	1663ms	864K
堆排序	AC	100	227ms	968K
冒泡排序	TLE	95	2848ms	732K
鸡尾酒排序	TLE	95	2548ms	636K
快速排序(2路)	AC	100	217ms	880K
快速排序(挖坑法)	AC	100	193ms	876K
快速排序(前后指针法)	AC	100	213ms	760K
快速排序(3路)	AC	100	217ms	784K
归并排序	AC	100	215ms	1264K
计数排序	AC	100	205ms	884K
基数排序	AC	100	211ms	1220K
桶排（低配版）	AC	100	221ms	872K
桶排（正常版）	AC	100	213ms	1664K

小测验

1.测验：在任何大小为 N 的输入数组上，这些算法中的哪一个以 O(N log N) 的速度运行？

a. 快速排序（确定性）
b. 插入排序
c. 合并排序
d. 冒泡排序

2.测验（不定项）：在对 N 个整数进行排序时，哪些算法的最坏情况时间复杂度为 $Θ(N^2)$ ？

a. 选择排序
b. 插入排序
c. 合并排序
d. 基数排序
e. 冒泡排序

注： $Θ$ 是一个紧密的时间复杂度分析，其中最佳情况 $Ω$ 和最坏情况的 $bi g - O$ 分析互相匹配

Answer :

c
a, b, e

~~(笑死，写这玩意儿电脑差点芭比Q)~~

你可能感兴趣的:(基础算法,算法,排序算法,c++,经验分享,数据结构)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

关于『基本算法』:常见八大排序

序言

入学手册 ~

一、分类

1. 内部排序和外部排序

2. 比较类排序和非比较排序

二、复杂度分析，算法稳定性和自适应

三、名词解释：

四、如何选择排序算法

1. 选择排序算法准则：

2. 选择排序算法的依据:

3. 选择排序算法的方法:

>>> 设待排序元素的个数为 n n n

一、插入排序 (Insertion Sort)

(一). 直接插入排序 (Straight Insertion Sort)

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1 插入排序的使用场景

3. 特性

4.动画演示:

5.函数原型

(二). 希尔排序 (Shell Sort)

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1 希尔排序的诞生与本质

Part2 \text{Part2} Part2 适用场景

Part3 \text{Part3} Part3 补充拓展

真 · 一个奇怪的小知识~

3. 特性

4.动画演示:

图解：

5.函数原型

真 · 一个奇怪的小知识~

二、选择排序 ( S e l e c t i o n S o r t ) (Selection\ Sort) (Selection Sort)

(一). 直接选择排序 (Straight Selection Sort) \text{(Straight Selection Sort)} (Straight Selection Sort)

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1 永远不要使用选择排序

3. 特性

4.动画演示:

5.函数原型

(二). 堆排序 (Heap Sort) \text{(Heap Sort)} (Heap Sort)

堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1 堆排的空间及时间复杂度

Part2 \text{Part2} Part2 关于大小顶堆

真 · 一个奇怪的小知识~

3. 特性

4.动画演示:（就这张让我悟了）

5.函数原型

真 · 又一个奇怪的小知识~

三、交换排序 ( E x c h a n g e S o r t ) (Exchange\ Sort) (Exchange Sort)

(一). 冒泡排序 (Bubble Sort) \text{(Bubble Sort)} (Bubble Sort)

冒泡排序，是一种计算机科学领域的较简单的排序算法，也是在下学会的第一个算法

1.基本思想:

真 · 一个奇怪的小知识~

2. 讨论：

Part1 \text{Part1} Part1 冒泡排序真的好慢！

3. 特性

4.动画演示:

5.函数原型

6.改进

鸡尾酒排序 (Cocktail Sort) \text{(Cocktail Sort)} (Cocktail Sort)

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1

3. 特性

4.函数原型

(二). 快速排序 (Quick Sort) \text{(Quick Sort)} (Quick Sort)

1.基本思想:

2. 讨论：

Part1 \text{Part1} Part1 关于快排

Part2 \text{Part2} Part2 关于时间复杂度

Part3 \text{Part3} Part3 关于空间复杂度

3. 特性

4.动画演示:

5.函数原型

真 · 又一个奇怪的小知识~

6.其他版本

>>> 设待排序元素的个数为 $n$

$\text{Part1}$ 插入排序的使用场景

$\text{Part1}$ 希尔排序的诞生与本质

$\text{Part2}$ 适用场景

$\text{Part3}$ 补充拓展

二、选择排序 $(Selection\ Sort)$

(一). 直接选择排序 $\text{(Straight Selection Sort)}$

$\text{Part1}$ 永远不要使用选择排序

(二). 堆排序 $\text{(Heap Sort)}$

$\text{Part1}$ 堆排的空间及时间复杂度

$\text{Part2}$ 关于大小顶堆

三、交换排序 $(Exchange\ Sort)$

(一). 冒泡排序 $\text{(Bubble Sort)}$

$\text{Part1}$ 冒泡排序真的好慢！

鸡尾酒排序 $\text{(Cocktail Sort)}$

$\text{Part1}$

(二). 快速排序 $\text{(Quick Sort)}$

$\text{Part1}$ 关于快排

$\text{Part2}$ 关于时间复杂度

$\text{Part3}$ 关于空间复杂度

$\text{Part1}$

(二). 快速排序三路分区 $\text{(Quick Sort 3-Way})$

$\text{Part1}$ 关于三路快排的产生

$\text{Part2}$ 关于三路快排的特性

$\text{Part1}$ 代码易错点

四、归并排序 $\text{(Merge Sort)}$

$\text{Part1}$ 归并的优点

$\text{Part2}$ 使用场所

$\text{Part3}$

五、计数排序 $\text{(Counting Sort)}$

$\text{Part1}$ 计数的优势

$\text{Part2}$ 非比较的稳定排序

$\text{Part3}$

六、基数排序 $\text{(Radix Sort)}$

$\text{Part1}$ 关于基数排序

$\text{Part2}$ 如何按关键字存储

$\text{Part3}$

最高位优先法 $(Most\ Significant\ Digit\ first)$ ，简称 MSD 法：

最低位优先法 $(Least\ Significant\ Digit\ first)$ ，简称 LSD 法：

七、桶排序 $\text{(Bucket Sort)}$