张伯毅

数据结构与算法之美笔记 : 堆排序及应用

概念

只要满足这两点，它就是一个堆。

堆是一个完全二叉树；

堆中每一个节点的值都必须大于等于（或小于等于）其子树中每个节点的值。

第一点，堆必须是一个完全二叉树。还记得我们之前讲的完全二叉树的定义吗？完全二叉树要求，除了最后一层，其他层的节点个数都是满的，最后一层的节点都靠左排列。

第二点，堆中的每个节点的值必须大于等于（或者小于等于）其子树中每个节点的值。实际上，我们还可以换一种说法，堆中每个节点的值都大于等于（或者小于等于）其左右子节点的值。这两种表述是等价的。

对于每个节点的值都大于等于子树中每个节点值的堆，我们叫作“大顶堆”。

对于每个节点的值都小于等于子树中每个节点值的堆，我们叫作“小顶堆”。

如下图： 1，2 为 “大顶堆” 3，4 为“小顶堆”

堆实现

用数组实现：

从图中我们可以看到，

数组中下标为 i 的节点的左子节点，就是下标为 i∗2 的节点，

右子节点就是下标为 i∗2+1 的节点，父节点就是下标为 i/2 的节点。

1. 往堆中插入一个元素

如果我们把新插入的元素放到堆的最后，你可以看我画的这个图，是不是不符合堆的特性了？

于是，我们就需要进行调整，让其重新满足堆的特性，这个过程我们起了一个名字，就叫作堆化（heapify）。

堆化实际上有两种，从下往上和从上往下。这里我先讲从下往上的堆化方法。

堆化非常简单，就是顺着节点所在的路径，向上或者向下，对比，然后交换。

我这里画了一张堆化的过程分解图。我们可以让新插入的节点与父节点对比大小。

如果不满足子节点小于等于父节点的大小关系，我们就互换两个节点。

一直重复这个过程，直到父子节点之间满足刚说的那种大小关系。

public class Heap {
  private int[] a; // 数组，从下标 1 开始存储数据
  private int n;  // 堆可以存储的最大数据个数
  private int count; // 堆中已经存储的数据个数

  public Heap(int capacity) {
    a = new int[capacity + 1];
    n = capacity;
    count = 0;
  }

  public void insert(int data) {
    if (count >= n) return; // 堆满了
    ++count;
    a[count] = data;
    int i = count;
    while (i/2 > 0 && a[i] > a[i/2]) { // 自下往上堆化
      swap(a, i, i/2); // swap() 函数作用：交换下标为 i 和 i/2 的两个元素
      i = i/2;
    }
  }
 }

2. 删除堆顶元素

从堆的定义的第二条中，任何节点的值都大于等于（或小于等于）子树节点的值，

我们可以发现，堆顶元素存储的就是堆中数据的最大值或者最小值。

假设我们构造的是大顶堆，堆顶元素就是最大的元素。当我们删除堆顶元素之后，就需要把第二大的元素放到堆顶，那第二大元素肯定会出现在左右子节点中。然后我们再迭代地删除第二大节点，以此类推，直到叶子节点被删除。

这里我也画了一个分解图。不过这种方法有点问题，就是最后堆化出来的堆并不满足完全二叉树的特性。

实际上，我们稍微改变一下思路，就可以解决这个问题。

你看我画的下面这幅图。我们把最后一个节点放到堆顶，然后利用同样的父子节点对比方法。

对于不满足父子节点大小关系的，互换两个节点，并且重复进行这个过程，直到父子节点之间满足大小关系为止。

这就是从上往下的堆化方法。

因为我们移除的是数组中的最后一个元素，而在堆化的过程中，都是交换操作，

不会出现数组中的“空洞”，所以这种方法堆化之后的结果，肯定满足完全二叉树的特性。

public void removeMax() {
  if (count == 0) return -1; // 堆中没有数据
  a[1] = a[count];
  --count;
  heapify(a, count, 1);
}

private void heapify(int[] a, int n, int i) { // 自上往下堆化
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

我们知道，一个包含 n 个节点的完全二叉树，树的高度不会超过 log2n 。

堆化的过程是顺着节点所在路径比较交换的，所以堆化的时间复杂度跟树的高度成正比，也就是 O(logn)。

插入数据和删除堆顶元素的主要逻辑就是堆化，所以，往堆中插入一个元素和删除堆顶元素的时间复杂度都是 O(logn)。

堆实现排序？

有时间复杂度是 O(n2) 的冒泡排序、插入排序、选择排序，

有时间复杂度是 O(nlog⁡n) 的归并排序、快速排序，还有线性排序。

堆排序的时间复杂度非常稳定，是 O(nlogn)，并且它还是原地排序算法。

堆排序的过程大致分解成两个大的步骤，建堆和排序。

1. 建堆

我们首先将数组原地建成一个堆。所谓“原地”就是，不借助另一个数组，就在原数组上操作。

建堆的过程，有两种思路。

第一种是借助我们前面讲的，在堆中插入一个元素的思路。

尽管数组中包含 n 个数据，但是我们可以假设，起初堆中只包含一个数据，就是下标为 1 的数据。

然后，我们调用前面讲的插入操作，将下标从 2 到 n 的数据依次插入到堆中。

这样我们就将包含 n 个数据的数组，组织成了堆。

第二种实现思路，跟第一种截然相反，也是我这里要详细讲的。

第一种建堆思路的处理过程是从前往后处理数组数据，并且每个数据插入堆中时，都是从下往上堆化。

而第二种实现思路，是从后往前处理数组，并且每个数据都是从上往下堆化。

我举了一个例子，并且画了一个第二种实现思路的建堆分解步骤图，你可以看下。

因为叶子节点往下堆化只能自己跟自己比较，所以我们直接从第一个非叶子节点开始，依次堆化就行了。

private static void buildHeap(int[] a, int n) {
  for (int i = n/2; i >= 1; --i) {
    heapify(a, n, i);
  }
}

private static void heapify(int[] a, int n, int i) {
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

在这段代码中，我们对下标从 n2 开始到 1 的数据进行堆化，下标是 n/2+1到 n 的节点是叶子节点，我们不需要堆化。

实际上，对于完全二叉树来说，下标从 n/2+1 到 n的节点都是叶子节点。

每个节点堆化的时间复杂度是 O(logn)，那 n/2+1 个节点堆化的总时间复杂度是不是就是 O(nlogn)呢？

这个答案虽然也没错，但是这个值还是不够精确。实际上，堆排序的建堆过程的时间复杂度是 O(n)。

我带你推导一下。

因为叶子节点不需要堆化，所以需要堆化的节点从倒数第二层开始。

每个节点堆化的过程中，需要比较和交换的节点个数，跟这个节点的高度 k 成正比。

我把每一层的节点个数和对应的高度画了出来，你可以看看。

我们只需要将每个节点的高度求和，得出的就是建堆的时间复杂度。

我们将每个非叶子节点的高度求和，就是下面这个公式：

这个公式的求解稍微有点技巧，不过我们高中应该都学过：把公式左右都乘以 2，就得到另一个公式 S2。

我们将 S2 错位对齐，并且用 S2 减去 S1，可以得到 S。

S 的中间部分是一个等比数列，所以最后可以用等比数列的求和公式来计算，最终的结果就是下面图中画的这个样子。

因为 h=log2n ，代入公式 S，就能得到 S=O(n) ，所以，建堆的时间复杂度就是 O(n)。

2. 排序

建堆结束之后，数组中的数据已经是按照大顶堆的特性来组织的。

数组中的第一个元素就是堆顶，也就是最大的元素。

我们把它跟最后一个元素交换，那最大元素就放到了下标为 n 的位置。

这个过程有点类似上面讲的“删除堆顶元素”的操作，当堆顶元素移除之后，

我们把下标为 n 的元素放到堆顶，然后再通过堆化的方法，将剩下的 n−1个元素重新构建成堆。

堆化完成之后，我们再取堆顶的元素，放到下标是 n−1n−1 的位置，一直重复这个过程，

直到最后堆中只剩下标为 1的一个元素，排序工作就完成了。

// n 表示数据的个数，数组 a 中的数据从下标 1 到 n 的位置。
public static void sort(int[] a, int n) {
  buildHeap(a, n);
  int k = n;
  while (k > 1) {
    swap(a, 1, k);
    --k;
    heapify(a, k, 1);
  }
}

现在，我们再来分析一下堆排序的时间复杂度、空间复杂度以及稳定性。

整个堆排序的过程，都只需要极个别临时存储空间，所以堆排序是原地排序算法。

堆排序包括建堆和排序两个操作，建堆过程的时间复杂度是 O(n)，

排序过程的时间复杂度是O(nlog⁡n)，所以，堆排序整体的时间复杂度是 O(nlogn)。

堆排序不是稳定的排序算法，因为在排序的过程，存在将堆的最后一个节点跟堆顶节点互换的操作，

所以就有可能改变值相同数据的原始相对顺序。

在前面的讲解以及代码中，我都假设，堆中的数据是从数组下标为 1 的位置开始存储。

那如果从 0 开始存储，实际上处理思路是没有任何变化的，唯一变化的，

可能就是，代码实现的时候，计算子节点和父节点的下标的公式改变了。

如果节点的下标是 i，那左子节点的下标就是 2∗i+1，右子节点的下标就是 2∗i+2，父节点的下标就是 i−1/2。

为什么快速排序要比堆排序性能好？

对于快速排序来说，数据是顺序访问的。

而对于堆排序来说，数据是跳着访问的。

比如，堆排序中，最重要的一个操作就是数据的堆化。

比如下面这个例子，对堆顶节点进行堆化，会依次访问数组下标是 1，2，4，81，2，4，8 的元素，而不是像快速排序那样，

局部顺序访问，所以，这样对 CPU 缓存是不友好的。

第二点，对于同样的数据，在排序过程中，堆排序算法的数据交换次数要多于快速排序。

我们在讲排序的时候，提过两个概念，有序度和逆序度。

对于基于比较的排序算法来说，整个排序过程就是由两个基本的操作组成的，比较和交换（或移动）。

快速排序数据交换的次数不会比逆序度多。

但是堆排序的第一步是建堆，建堆的过程会打乱数据原有的相对先后顺序，导致原数据的有序度降低。

比如，对于一组已经有序的数据来说，经过建堆之后，数据反而变得更无序了。

对于第二点，你可以自己做个试验看下。

我们用一个记录交换次数的变量，在代码中，每次交换的时候，我们就对这个变量加一，

排序完成之后，这个变量的值就是总的数据交换次数。

这样你就能很直观地理解我刚刚说的，堆排序比快速排序交换次数多。

应用

堆的应用一：优先级队列

首先，我们来看第一个应用场景：优先级队列。

优先级队列，顾名思义，它首先应该是一个队列。

我们前面讲过，队列最大的特性就是先进先出。

不过，在优先级队列中，数据的出队顺序不是先进先出，而是按照优先级来，优先级最高的，最先出队。

如何实现一个优先级队列呢？

方法有很多，但是用堆来实现是最直接、最高效的。

这是因为，堆和优先级队列非常相似。一个堆就可以看作一个优先级队列。

很多时候，它们只是概念上的区分而已。

往优先级队列中插入一个元素，就相当于往堆中插入一个元素；

从优先级队列中取出优先级最高的元素，就相当于取出堆顶元素。

你可别小看这个优先级队列，它的应用场景非常多。

我们后面要讲的很多数据结构和算法都要依赖它。

比如，赫夫曼编码、图的最短路径、最小生成树算法等等。

不仅如此，很多语言中，都提供了优先级队列的实现，比如，Java 的 PriorityQueue，C++ 的 priority_queue 等。

举两个具体的例子，让你感受一下优先级队列具体是怎么用的。

1. 合并有序小文件

假设我们有 100 个小文件，每个文件的大小是 100MB，每个文件中存储的都是有序的字符串。

我们希望将这些 100 个小文件合并成一个有序的大文件。

这里就会用到优先级队列。

整体思路有点像归并排序中的合并函数。

我们从这 100 个文件中，各取第一个字符串，放入数组中，然后比较大小，

把最小的那个字符串放入合并后的大文件中，并从数组中删除。

假设，这个最小的字符串来自于 13.txt 这个小文件，我们就再从这个小文件取下一个字符串，放到数组中，重新比较大小，并且选择最小的放入合并后的大文件，将它从数组中删除。

依次类推，直到所有的文件中的数据都放入到大文件为止。

这里我们用数组这种数据结构，来存储从小文件中取出来的字符串。

每次从数组中取最小字符串，都需要循环遍历整个数组，显然，这不是很高效。

有没有更加高效方法呢？

这里就可以用到优先级队列，也可以说是堆。

我们将从小文件中取出来的字符串放入到小顶堆中，那堆顶的元素，也就是优先级队列队首的元素，就是最小的字符串。

我们将这个字符串放入到大文件中，并将其从堆中删除。

然后再从小文件中取出下一个字符串，放入到堆中。

循环这个过程，就可以将 100 个小文件中的数据依次放入到大文件中。

2. 高性能定时器

假设我们有一个定时器，定时器中维护了很多定时任务，每个任务都设定了一个要触发执行的时间点。

定时器每过一个很小的单位时间（比如 1 秒），就扫描一遍任务，看是否有任务到达设定的执行时间。

如果到达了，就拿出来执行。

但是，这样每过 1 秒就扫描一遍任务列表的做法比较低效，主要原因有两点：

第一，任务的约定执行时间离当前时间可能还有很久，这样前面很多次扫描其实都是徒劳的；

第二，每次都要扫描整个任务列表，如果任务列表很大的话，势必会比较耗时。

针对这些问题，我们就可以用优先级队列来解决。我们按照任务设定的执行时间，将这些任务存储在优先级队列中，队列首部（也就是小顶堆的堆顶）存储的是最先执行的任务。

这样，定时器就不需要每隔 1 秒就扫描一遍任务列表了。

它拿队首任务的执行时间点，与当前时间点相减，得到一个时间间隔 T。

这个时间间隔 T 就是，从当前时间开始，需要等待多久，才会有第一个任务需要被执行。

这样，定时器就可以设定在 T 秒之后，再来执行任务。从当前时间点到（T-1）秒这段时间里，定时器都不需要做任何事情。

当 T 秒时间过去之后，定时器取优先级队列中队首的任务执行。然后再计算新的队首任务的执行时间点与当前时间点的差值，把这个值作为定时器执行下一个任务需要等待的时间。

这样，定时器既不用间隔 1 秒就轮询一次，也不用遍历整个任务列表，性能也就提高了。

堆的应用二：利用堆求 Top K

刚刚我们学习了优先级队列，我们现在来看，堆的另外一个非常重要的应用场景，那就是“求 Top K 问题”。

我把这种求 Top K 的问题抽象成两类。

一类是针对静态数据集合，也就是说数据集合事先确定，不会再变。

另一类是针对动态数据集合，也就是说数据集合事先并不确定，有数据动态地加入到集合中。

针对静态数据，如何在一个包含 n 个数据的数组中，查找前 K 大数据呢？

我们可以维护一个大小为 K 的小顶堆，顺序遍历数组，从数组中取出数据与堆顶元素比较。

如果比堆顶元素大，我们就把堆顶元素删除，并且将这个元素插入到堆中；

如果比堆顶元素小，则不做处理，继续遍历数组。

这样等数组中的数据都遍历完之后，堆中的数据就是前 K 大数据了。

遍历数组需要 O(n) 的时间复杂度，一次堆化操作需要 O(logK) 的时间复杂度，

所以最坏情况下，n 个元素都入堆一次，时间复杂度就是 O(nlogK)。

针对动态数据求得 Top K 就是实时 Top K。怎么理解呢？

我举一个例子。一个数据集合中有两个操作，一个是添加数据，另一个询问当前的前 K 大数据。

如果每次询问前 K 大数据，我们都基于当前的数据重新计算的话，那时间复杂度就是 O(nlogK)，n 表示当前的数据的大小。

实际上，我们可以一直都维护一个 K 大小的小顶堆，当有数据被添加到集合中时，我们就拿它与堆顶的元素对比。

如果比堆顶元素大，我们就把堆顶元素删除，并且将这个元素插入到堆中；

如果比堆顶元素小，则不做处理。

这样，无论任何时候需要查询当前的前 K 大数据，我们都可以立刻返回给他。

堆的应用三：利用堆求中位数

前面我们讲了如何求 Top K 的问题，现在我们来讲下，如何求动态数据集合中的中位数。

中位数，顾名思义，就是处在中间位置的那个数。

如果数据的个数是奇数，把数据从小到大排列，那第 n/2+1 个数据就是中位数；

如果数据的个数是偶数的话，那处于中间位置的数据有两个，第 n/2 个和第 n/2+1 个数据，这个时候，我们可以随意取一个作为中位数，比如取两个数中靠前的那个，就是第 n/2个数据。

对于一组静态数据，中位数是固定的，我们可以先排序，第 n/2个数据就是中位数。

每次询问中位数的时候，我们直接返回这个固定的值就好了。

所以，尽管排序的代价比较大，但是边际成本会很小。

但是，如果我们面对的是动态数据集合，中位数在不停地变动，如果再用先排序的方法，

每次询问中位数的时候，都要先进行排序，那效率就不高了。

借助堆这种数据结构，我们不用排序，就可以非常高效地实现求中位数操作。我们来看看，它是如何做到的？

我们需要维护两个堆，一个大顶堆，一个小顶堆。

大顶堆中存储前半部分数据，小顶堆中存储后半部分数据，且小顶堆中的数据都大于大顶堆中的数据。

也就是说，如果有 n 个数据，n 是偶数，我们从小到大排序，那前 n/2 个数据存储在大顶堆中，后 n/2 个数据存储在小顶堆中。这样，大顶堆中的堆顶元素就是我们要找的中位数。如果 n 是奇数，情况是类似的，大顶堆就存储 n/2+1个数据，小顶堆中就存储 n/2 个数据。

我们前面也提到，数据是动态变化的，当新添加一个数据的时候，我们如何调整两个堆，让大顶堆中的堆顶元素继续是中位数呢？

如果新加入的数据小于等于大顶堆的堆顶元素，我们就将这个新数据插入到大顶堆；

否则，我们就将这个新数据插入到小顶堆。

这个时候就有可能出现，两个堆中的数据个数不符合前面约定的情况：

如果 n 是偶数，两个堆中的数据个数都是 n/2；

如果 n 是奇数，大顶堆有 n/2+1 个数据，小顶堆有 n2n2 个数据。

这个时候，我们可以从一个堆中不停地将堆顶元素移动到另一个堆，

通过这样的调整，来让两个堆中的数据满足上面的约定。

于是，我们就可以利用两个堆，一个大顶堆、一个小顶堆，实现在动态数据集合中求中位数的操作。

插入数据因为需要涉及堆化，所以时间复杂度变成了 O(logn)，

但是求中位数我们只需要返回大顶堆的堆顶元素就可以了，所以时间复杂度就是 O(1)。

实际上，利用两个堆不仅可以快速求出中位数，还可以快速求其他百分位的数据，原理是类似的。

还记得我们在“为什么要学习数据结构与算法”里的这个问题吗？“如何快速求接口的 99% 响应时间？”

我们现在就来看下，利用两个堆如何来实现。

在开始这个问题的讲解之前，我先解释一下，什么是“99% 响应时间”。

中位数的概念就是将数据从小到大排列，处于中间位置，就叫中位数，这个数据会大于等于前面 50% 的数据。

99 百分位数的概念可以类比中位数，如果将一组数据从小到大排列，这个 99 百分位数就是大于前面 99% 数据的那个数据。

如果你还是不太理解，我再举个例子。

假设有 100 个数据，分别是 1，2，3，……，100，那 99 百分位数就是 99，因为小于等于 99 的数占总个数的 99%。

弄懂了这个概念，我们再来看 99% 响应时间。如果有 100 个接口访问请求，每个接口请求的响应时间都不同，比如 55 毫秒、100 毫秒、23 毫秒等，我们把这 100 个接口的响应时间按照从小到大排列，排在第 99 的那个数据就是 99% 响应时间，也叫 99 百分位响应时间。

我们总结一下，如果有 n 个数据，将数据从小到大排列之后，99 百分位数大约就是第 n*99% 个数据，同类，80 百分位数大约就是第 n*80% 个数据。

弄懂了这些，我们再来看如何求 99% 响应时间。

我们维护两个堆，一个大顶堆，一个小顶堆。假设当前总数据的个数是 n，大顶堆中保存 n*99% 个数据，小顶堆中保存 n*1% 个数据。大顶堆堆顶的数据就是我们要找的 99% 响应时间。

每次插入一个数据的时候，我们要判断这个数据跟大顶堆和小顶堆堆顶数据的大小关系，然后决定插入到哪个堆中。如果这个新插入的数据比大顶堆的堆顶数据小，那就插入大顶堆；如果这个新插入的数据比小顶堆的堆顶数据大，那就插入小顶堆。

但是，为了保持大顶堆中的数据占 99%，小顶堆中的数据占 1%，在每次新插入数据之后，我们都要重新计算，这个时候大顶堆和小顶堆中的数据个数，是否还符合 99:1 这个比例。如果不符合，我们就将一个堆中的数据移动到另一个堆，直到满足这个比例。移动的方法类似前面求中位数的方法，这里我就不啰嗦了。

通过这样的方法，每次插入数据，可能会涉及几个数据的堆化操作，所以时间复杂度是 O(logn)。每次求 99% 响应时间的时候，直接返回大顶堆中的堆顶数据即可，时间复杂度是 O(1)。

内容小结

堆是一种完全二叉树。

它最大的特性是：每个节点的值都大于等于（或小于等于）其子树节点的值。因此，堆被分成了两类，大顶堆和小顶堆。

堆中比较重要的两个操作是插入一个数据和删除堆顶元素。

这两个操作都要用到堆化。

插入一个数据的时候，我们把新插入的数据放到数组的最后，然后从下往上堆化；

删除堆顶数据的时候，我们把数组中的最后一个元素放到堆顶，然后从上往下堆化。

这两个操作时间复杂度都是 O(logn)。

除此之外，我们还讲了堆的一个经典应用，堆排序。

堆排序包含两个过程，建堆和排序。

我们将下标从 n/2 到 1 的节点，依次进行从上到下的堆化操作，然后就可以将数组中的数据组织成堆这种数据结构。

接下来，我们迭代地将堆顶的元素放到堆的末尾，并将堆的大小减一，然后再堆化，

重复这个过程，直到堆中只剩下一个元素，整个数组中的数据就都有序排列了。

优先级队列是一种特殊的队列，优先级高的数据先出队，而不再像普通的队列那样，先进先出。

实际上，堆就可以看作优先级队列，只是称谓不一样罢了。

求 Top K 问题又可以分为针对静态数据和针对动态数据，只需要利用一个堆，就可以做到非常高效率的查询 Top K 的数据。

求中位数实际上还有很多变形，比如求 99 百分位数据、90 百分位数据等，处理的思路都是一样的，

即利用两个堆，一个大顶堆，一个小顶堆，随着数据的动态添加，

动态调整两个堆中的数据，最后大顶堆的堆顶元素就是要求的数据。

来源：

数据结构与算法之美王争

你可能感兴趣的:(数据结构与算法之美)

《数据结构与算法之美》01～05笔记太阳骑士索拉尔
关于我的仓库这篇文章是我为面试准备的学习总结中的一篇我将准备面试中找到的所有学习资料，写的Demo，写的博客都放在了这个仓库里iOS-Engineer-Interview欢迎star其中的博客在，CSDN都有发布博客中提到的相关的代码Demo可以在仓库里相应的文件夹里找到前言该系列为学习《数据结构与算法之美》的系列学习笔记总结规律为一周一更，内容包括其中的重要知识带你，以及课后题的解答算法的学习学
数据结构与算法之美学习笔记：50 | 索引：如何在海量数据中快速查找某个数据？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言为什么需要索引？索引的需求定义构建索引常用的数据结构有哪些？总结引申前言本节课程思维导图：在第48节中，我们讲了MySQL数据库索引的实现原理。MySQL底层依赖的是B+树这种数据结构。留言里有同学问我，那类似Redis这样的Key-Value数据库中的索引，又是怎么实现的呢？底层依赖的又是什么数据结构呢？今天，我就来讲一下索引这种常用的技术解决思路，底层往往会依赖哪些数据结构。同时，通过
数据结构与算法之美学习笔记：51 | 并行算法：如何利用并行处理提高算法的执行效率？浊酒南街数据结构与算法之美学习笔记算法数据结构
目录前言并行排序并行查找并行字符串匹配并行搜索总结引申前言本节课程思维导图：时间复杂度是衡量算法执行效率的一种标准。但是，时间复杂度并不能跟性能划等号。在真实的软件开发中，即便在不降低时间复杂度的情况下，也可以通过一些优化手段，提升代码的执行效率。毕竟，对于实际的软件开发来说，即便是像10%、20%这样微小的性能提升，也是非常可观的。算法的目的就是为了提高代码执行的效率。那当算法无法再继续优化的情
务实基础，从这开始 y0000c
写在前面文章的内容学习自【极客时间的付费专栏课程--数据结构与算法之美】，老师是王争。购买该专栏的原因有三：（1）个人希望巩固好数据结构与算法基础，提升个人能力（2）该专栏热度很高，好评如潮（怎么有种五星好评返现2元的感觉）（3）老师对学生的回复【迈不过数据结构与算法这个坎，你找我退钱】（ps：非原话）没人会找一个小白打广告，仅为总结，复盘一、目前个人情况1、咸鱼中的一员很遗憾，本人正是老师口中【
字符串匹配算法--数据结构与算法之美--CH32 csdn_SUSAN 数据结构和算法字符串匹配 RK算法 BF算法
文章目录1.什么是字符串匹配2.如何实现字符串匹配2.1BF算法2.2.1BF算法常用原因2.2RK算法2.2.1hash算法的设计2.2.2散列冲突处理3.其他算法简介4.思考总结1.什么是字符串匹配 “字符串匹配”就是在一个长字符串A中搜索一个短的字符串B，此时A称为主串，B称为模式串。把主串A的长度记作n，模式串B的长度记作m，因为在主串中查找模式串，所以n>m。2.如何实现字符串匹配
《数据结构与算法之美》22——递归树大杂草
前言在排序那一节里，讲到排序时，利用递推公式推导时间复杂度来求解归并排序、快速排序的时间复杂度，但有些情况，例如快速排序的平均时间复杂度，利用递推公式，会涉及很复杂的数据推导。今天学习一种特殊的树来分析递归算法的时间复杂度，那就是递归树。递归树与时间复杂度递归算法的思路是把大问题分成小问题来解决，一层一层的分解，直到问题规模足够小，不需要再递归为止。把这个一层一层的分解过程画成图，它其实是一颗树。
《数据结构与算法之美》笔记四数组大叔爱学习. 数据结构与算法之美数据结构算法链表
文章目录前言如何实现随机访问？低效的“插入”和“删除”警惕数组的访问越界问题容器能否完全替代数组？解答开篇内容小结思考题：前言是的，在每一种编程语言中，基本都会有数组这种数据类型。不过，它不仅仅是一种编程语言中的数据类型，还是一种最基础的数据结构。尽管数组看起来非常基础、简单，但是我估计很多人都并没有理解这个基础数据结构的精髓。在大部分编程语言中，数组都是从0开始编号的，但你是否下意识地想过，为什
数据结构与算法之美总结（数组、链表、栈、队列、递归、排序及二分） Fan 数据结构与算法数据结构
title:数据结构与算法之美总结（数组、链表、栈、队列、递归、排序及二分）date:2023-04-1501:41:26tags:数据结构算法categories:数据结构与算法cover:https://cover.pngfeature:false1.前言1、什么是数据结构？什么是算法？从广义上讲，数据结构就是指一组数据的存储结构。算法就是操作数据的一组方法从狭义上讲，是指某些著名的数据结构和
数据结构与算法之美-08讲栈：如何实现浏览器的前进和后退功能蒋斌文
特别备注本系列非原创，文章原文摘自极客时间-数据结构算法之美，用于平常学习记录。如有侵权，请联系我删除，谢谢！浏览器的前进、后退功能，我想你肯定很熟悉吧？当你依次访问完一串页面a-b-c之后，点击浏览器的后退按钮，就可以查看之前浏览过的页面b和a。当你后退到页面a，点击前进按钮，就可以重新查看页面b和c。但是，如果你后退到页面b后，点击了新的页面d，那就无法再通过前进、后退功能查看页面c了。假设你
数据结构与算法之美学习笔记：48 | B+树：MySQL数据库索引是如何实现的？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言算法解析总结引申前言本节课程思维导图：作为一个软件开发工程师，你对数据库肯定再熟悉不过了。作为主流的数据存储系统，它在我们的业务开发中，有着举足轻重的地位。在工作中，为了加速数据库中数据的查找速度，我们常用的处理思路是，对表中数据创建索引。那你是否思考过，数据库索引是如何实现的呢？底层使用的是什么数据结构和算法呢？算法解析思考的过程比结论更重要。今天的讲解，我会尽量还原这个解决方案的思考过
数据结构与算法之美笔记——基础篇（中）：树，二叉树，二叉查找树，平衡二叉查找树，红黑树，递归树，堆三角形代表重生数据结构与算法数据结构算法 java
树：A节点就是B节点的父节点，B节点是A节点的子节点。B、C、D这三个节点的父节点是同一个节点，所以它们之间互称为兄弟节点。我们把没有父节点的节点叫作根节点，也就是图中的节点E。我们把没有子节点的节点叫作叶子节点或者叶节点，比如图中的G、H、I、J、K、L都是叶子节点。二叉树（BinaryTree）二叉树，顾名思义，每个节点最多有两个“叉”，也就是两个子节点，分别是左子节点和右子节点。不过，二叉树
数据结构与算法之美学习笔记：47 | 向量空间：如何实现一个简单的音乐推荐系统？浊酒南街数据结构与算法之美学习笔记数据结构算法
这里写自定义目录标题前言算法解析总结引申前言本节课程思维导图：很多人都喜爱听歌，以前我们用MP3听歌，现在直接通过音乐App在线就能听歌。而且，各种音乐App的功能越来越强大，不仅可以自己选歌听，还可以根据你听歌的口味偏好，给你推荐可能会喜爱的音乐，而且有时候，推荐的音乐还非常适合你的口味，甚至会惊艳到你！如此智能的一个功能，你知道它是怎么实现的吗？算法解析实际上，要解决这个问题，并不需要特别高深
数据结构与算法之美学习笔记：46 | 概率统计：如何利用朴素贝叶斯算法过滤垃圾短信？浊酒南街数据结构与算法之美学习笔记算法数据结构
目录前言算法解析总结引申前言本节课程思维导图：上一节我们讲到，如何用位图、布隆过滤器，来过滤重复的数据。今天，我们再讲一个跟过滤相关的问题，如何过滤垃圾短信？垃圾短信和骚扰电话，我想每个人都收到过吧？买房、贷款、投资理财、开发票，各种垃圾短信和骚扰电话，不胜其扰。如果你是一名手机应用开发工程师，让你实现一个简单的垃圾短信过滤功能以及骚扰电话拦截功能，该用什么样的数据结构和算法实现呢？算法解析实际上
数据结构与算法之美学习笔记：45 | 位图：如何实现网页爬虫中的URL去重功能？浊酒南街数据结构与算法之美学习笔记爬虫数据结构算法
目录前言算法解析总结引申前言本节课程思维导图：网页爬虫是搜索引擎中的非常重要的系统，负责爬取几十亿、上百亿的网页。爬虫的工作原理是，通过解析已经爬取页面中的网页链接，然后再爬取这些链接对应的网页。而同一个网页链接有可能被包含在多个页面中，这就会导致爬虫在爬取的过程中，重复爬取相同的网页。如果你是一名负责爬虫的工程师，你会如何避免这些重复的爬取呢？最容易想到的方法就是，我们记录已经爬取的网页链接（也
数据结构与算法之美-26讲红黑树（下）蒋斌文
数据结构与算法之美-26讲红黑树（下）特别备注本系列非原创，文章原文摘自极客时间-数据结构算法之美，用于平常学习记录。如有侵权，请联系我删除，谢谢！红黑树是一个让我又爱又恨的数据结构，“爱”是因为它稳定、高效的性能，“恨”是因为实现起来实在太难了。我今天讲的红黑树的实现，对于基础不太好的同学，理解起来可能会有些困难。但是，我觉得没必要去死磕它。我为什么这么说呢？因为，即便你将左右旋背得滚瓜烂熟，我
数据结构与算法之美学习笔记：43 | 拓扑排序：如何确定代码源文件的编译依赖关系？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言算法解析1.Kahn算法2.DFS算法总结引申前言本节课程思维导图现在，我们就进入高级篇的第一节，如何确定代码源文件的编译依赖关系？我们知道，一个完整的项目往往会包含很多代码源文件。编译器在编译整个项目的时候，需要按照依赖关系，依次编译每个源文件。比如，A.cpp依赖B.cpp，那在编译的时候，编译器需要先编译B.cpp，才能编译A.cpp。编译器通过分析源文件或者程序员事先写好的编译配置
数据结构与算法之美学习笔记：44 | 最短路径：地图软件是如何计算出最优出行路径的？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言算法解析总结引申前言本节课程思维导图：我们学习了图的两种搜索算法，深度优先搜索和广度优先搜索。这两种算法主要是针对无权图的搜索算法。针对有权图，也就是图中的每条边都有一个权重，我们该如何计算两点之间的最短路径（经过的边的权重和最小）呢？今天，我就从地图软件的路线规划问题讲起，带你看看常用的最短路径算法（ShortestPathAlgorithm）。像Google地图、百度地图、高德地图这样
笔记：数据结构与算法之美 06 | 链表（上）：如何实现LRU缓存淘汰算法? 金陵砍柴人链表数据结构算法
LRU缓存淘汰算法优先淘汰最近最少使用的数据Least最少Recently最近Used使用链表和数组底层存储结构不同数组需要一块连续的内存空间来存储链表不需要，他通过指针将一组零散的内存块串联起来使用五花八门的链表结构单链表双向链表循环链表单链表每一组零散的内存块称之为结点记录下个结点地址的指针叫作后继指针next有两个特殊结点第一个结点头结点，记录链表的基地址最后一个结点尾结点，指针不是指向下一
笔记：数据结构与算法之美 05 | 数组：为什么很多编程语言中数组都从0开始编号？金陵砍柴人数据结构算法链表
数组一种线性表数据结构一组连续的内存空间存储一组具有相同类型的数据线性表（LinearList）数据排成一条线一样的结构数据最多只有前和后两个方向tips：除了数组，链表、队列、栈等也是线性表结构非线性表数据之间并不是简单的前后关系tips：比如二叉树、堆、图等连续的内存空间和相同类型的数据正因如此，才有了“随机访问”的特性数组如何实现根据下标随机访问数组元素？通过如下寻址公式，计算出该元素存储的
[44]最短路径：地图软件是如何计算出最优出行路径的？ _魔佃_
GeekTime数据结构与算法之美(ఠൠఠ)ﾉ真心推荐极客时间我们本科都学习过图的两种搜索算法，深度优先搜索和广度优先搜索。这两种算法主要是针对无权图的搜索算法。针对有权图，也就是图中的每条边都有一个权重，我们该如何计算两点之间的最短路径（经过的边的权重和最小）呢？今天，我就从地图软件的路线规划问题讲起，带你看看常用的最短路径算法。像Google地图、百度地图、高德地图这样的地图软件，我想你应该经
数据结构与算法之美学习笔记：42 | 动态规划实战：如何实现搜索引擎中的拼写纠错功能？浊酒南街数据结构与算法之美学习笔记动态规划数据结构算法
目录前言如何量化两个字符串的相似度？如何编程计算莱文斯坦距离？如何编程计算最长公共子串长度？解答开篇前言本节课程思维导图：利用Trie树，可以实现搜索引擎的关键词提示功能，这样可以节省用户输入搜索关键词的时间。实际上，搜索引擎在用户体验方面的优化还有很多，比如你可能经常会用的拼写纠错功能。当你在搜索框中，一不小心输错单词时，搜索引擎会非常智能地检测出你的拼写错误，并且用对应的正确单词来进行搜索。作
数据结构与算法之美学习笔记：41 | 动态规划理论：一篇文章带你彻底搞懂最优子结构、无后效性和重复子问题浊酒南街数据结构与算法之美学习笔记动态规划算法数据结构
目录前言“一个模型三个特征”理论讲解“一个模型三个特征”实例剖析两种动态规划解题思路总结四种算法思想比较分析内容小结前言本节课程思维导图：今天，我主要讲动态规划的一些理论知识。学完这节内容，可以帮你解决这样几个问题：什么样的问题可以用动态规划解决？解决动态规划问题的一般思考过程是什么样的？贪心、分治、回溯、动态规划这四种算法思想又有什么区别和联系？“一个模型三个特征”理论讲解什么样的问题适合用动态
数据结构与算法之美学习笔记：40 | 初识动态规划：如何巧妙解决“双十一”购物时的凑单问题？浊酒南街数据结构与算法之美学习笔记动态规划算法数据结构
这里写自定义目录标题前言动态规划学习路线0-1背包问题0-1背包问题升级版解答开篇内容小结前言本节课程思维导图：淘宝的“双十一”购物节有各种促销活动，比如“满200元减50元”。假设你女朋友的购物车中有n个（n>100）想买的商品，她希望从里面选几个，在凑够满减条件的前提下，让选出来的商品价格总和最大程度地接近满减条件（200元），这样就可以极大限度地“薅羊毛”。作为程序员的你，能不能编个代码来帮
数据结构与算法之美-09讲队列蒋斌文
数据结构与算法之美-09讲队列特别备注本系列非原创，文章原文摘自极客时间-数据结构算法之美，用于平常学习记录。如有侵权，请联系我删除，谢谢！我们知道，CPU资源是有限的，任务的处理速度与线程个数并不是线性正相关。相反，过多的线程反而会导致CPU频繁切换，处理性能下降。所以，线程池的大小一般都是综合考虑要处理任务的特点和硬件环境，来事先设置的。当我们向固定大小的线程池中请求一个线程时，如果线程池中没
数据结构与算法之美学习笔记：39 | 回溯算法：从电影《蝴蝶效应》中学习回溯算法的核心思想浊酒南街数据结构与算法之美学习笔记算法数据结构
目录前言如何理解“回溯算法”？两个回溯算法的经典应用内容小结前言本节课程思维导图：我们在前面深度优先搜索算法利用的是回溯算法思想。这个算法思想非常简单，但是应用却非常广泛。它除了用来指导像深度优先搜索这种经典的算法设计之外，还可以用在很多实际的软件开发场景中，比如正则表达式匹配、编译原理中的语法分析等。除此之外，很多经典的数学问题都可以用回溯算法解决，比如数独、八皇后、0-1背包、图的着色、旅行商
数据结构与算法之美学习笔记：38 | 分治算法：谈一谈大规模计算框架MapReduce中的分治思想浊酒南街数据结构与算法之美学习笔记算法数据结构
目录前言如何理解分治算法？分治算法应用举例分析分治思想在海量数据处理中的应用解答开篇内容小结前言本节课程思维导图：MapReduce是Google大数据处理的三驾马车之一，另外两个是GFS（hdfs）和Bigtable(hbase)。它在倒排索引、PageRank计算、网页分析等搜索引擎相关的技术中都有大量的应用。MapReduce的本质就是我们今天要学的这种算法思想，分治算法。如何理解分治算法？
数据结构与算法之美学习笔记：37 | 贪心算法：如何用贪心算法实现Huffman压缩编码？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言如何理解“贪心算法”？贪心算法实战分析解答开篇内容小结前言本节课程思维导图：接下来几节，我会讲几种更加基本的算法。它们分别是贪心算法、分治算法、回溯算法、动态规划。更加确切地说，它们应该是算法思想，并不是具体的算法，常用来指导我们设计具体的算法和编码等。贪心、分治、回溯、动态规划这4个算法思想，原理解释起来都很简单，但是要真正掌握且灵活应用，并不是件容易的事情。今天，我们先来学习一下贪心算
数据结构与算法之美学习笔记：36 | AC自动机：如何用多模式串匹配实现敏感词过滤功能？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言基于单模式串和Trie树实现的敏感词过滤经典的多模式串匹配算法：AC自动机解答开篇内容小结前言本节课程思维导图：很多支持用户发表文本内容的网站，比如BBS，大都会有敏感词过滤功能，用来过滤掉用户输入的一些淫秽、反动、谩骂等内容。你有没有想过，这个功能是怎么实现的呢？实际上，这些功能最基本的原理就是字符串匹配算法，也就是通过维护一个敏感词的字典，当用户输入一段文字内容之后，通过字符串匹配算法
数据结构与算法之美笔记——基础篇（下）：图、字符串匹配算法（BF 算法和 RK 算法、BM 算法和 KMP 算法、Trie 树和 AC 自动机）三角形代表重生数据结构与算法数据结构算法
图如何存储微博、微信等社交网络中的好友关系？图。实际上，涉及图的算法有很多，也非常复杂，比如图的搜索、最短路径、最小生成树、二分图等等。我们今天聚焦在图存储这一方面，后面会分好几节来依次讲解图相关的算法。如何理解“图”？我们前面讲过了树这种非线性表数据结构，今天我们要讲另一种非线性表数据结构，图（Graph）。和树比起来，这是一种更加复杂的非线性表结构。图中的元素我们就叫作顶点（vertex）。图
数据结构与算法之美学习笔记：35 | Trie树：如何实现搜索引擎的搜索关键词提示功能？浊酒南街数据结构与算法之美学习笔记数据结构算法
目录前言什么是“Trie树”？如何实现一棵Trie树？Trie树真的很耗内存吗？Trie树与散列表、红黑树的比较解答开篇内容小结前言本节课程思维导图：搜索引擎的搜索关键词提示功能，我想你应该不陌生吧？为了方便快速输入，当你在搜索引擎的搜索框中，输入要搜索的文字的某一部分的时候，搜索引擎就会自动弹出下拉框，里面是各种关键词提示。你是否思考过，它是怎么实现的呢？它底层使用的是哪种数据结构和算法呢？其底
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl