highfei2011

[Java排序算法]--堆排序 (Heap Sort)

前言

最近遇到一个求解TopN的场景，从1亿条数据中，找出最大或者最小的10个数。

怎么办？不可能对数据进行全排序吧，哪里有那么大的内存空间！谷歌搜索了相关的解决方案，最终定位在使用堆排序解决这个问题。

摘要

1、什么是二叉树？

2、什么是堆？

3、堆排序原理？

4、堆排序的Java实现。

5、堆排序的Scala实现。

主要内容

一、什么是二叉树

参考：https://zh.wikipedia.org/wiki/%E4%BA%8C%E5%8F%89%E6%A0%91

要了解堆首先需要了解下二叉树（英语：Binary tree），在计算机科学中，二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”（left subtree）和“右子树”（right subtree）。二叉树常被用于实现二叉查找树和二叉堆。

二叉树的每个结点至多只有二棵子树（不存在度大于 2 的结点），二叉树的子树有左右之分，次序不能颠倒。二叉树的第 i 层至多有 2i - 1 个结点；深度为 k 的二叉树至多有 2k - 1 个结点；对任何一棵二叉树 T，如果其终端结点数为 n0，度为 2 的结点数为 n2，则n0 = n2 + 1。

树和二叉树的三个主要差别：

树的结点个数至少为 1，而二叉树的结点个数可以为 0
树中结点的最大度数没有限制，而二叉树结点的最大度数为 2
树的结点无左、右之分，而二叉树的结点有左、右之分

二叉树又分为完全二叉树（complete binary tree）和满二叉树（full binary tree）

(1)满二叉树：一棵深度为 k，且有 2k - 1 个节点称之为满二叉树

深度为 3 的满二叉树 full binary tree。

(2)完全二叉树：深度为 k，有 n 个节点的二叉树，当且仅当其每一个节点都与深度为 k 的满二叉树中序号为 1 至 n 的节点对应时，称之为完全二叉树

深度为 3 的完全二叉树 complete binary tree

二、什么是堆？

堆（二叉堆）可以视为一棵完全的二叉树，完全二叉树的一个“优秀”的性质是，除了最底层之外，每一层都是满的，这使得堆可以利用数组来表示（普通的一般的二叉树通常用链表作为基本容器表示），每一个结点对应数组中的一个元素。

如下图，是一个堆和数组的相互关系：

《算法导论》中谈到：对于给定的某个结点的下标 i，可以很容易的计算出这个结点的父结点、左孩子结点和右孩子节点的下标(基于下标以1开始)：

Parent(i) = floor(i/2)，i 的父节点下标(向下取整)
Left(i) = 2i，i 的左子节点下标
Right(i) = 2i + 1，i 的右子节点下标

二叉堆一般分为两种：最大堆和最小堆。

最大堆：

最大堆的最大元素在根结点（堆顶）
堆中每个父节点的元素值都大于等于其孩子结点

最小堆：

最小堆的最小元素值在根结点（堆顶）
堆中每个父节点的元素值都小于等于其孩子结点

三、堆排序原理

堆排序就是把最大堆堆顶的最大数取出，将剩余的堆继续调整为最大堆，再次将堆顶的最大数取出，这个过程持续到剩余数只有一个时结束。

在堆中定义以下几种操作：

最大堆调整（Max-Heapify）：将堆的末端子节点作调整，使得子节点永远小于父节点，保证最大堆性质
创建最大堆（Build-Max-Heap）：将堆所有数据重新排序，使其成为最大堆
堆排序（Heap-Sort）：移除位在第一个数据的根节点，并做最大堆调整的递归运算

这里我们需要注意：数组都是 Zero-Based，这就意味着我们的堆数据结构模型要发生改变。

相应的，几个计算公式也要作出相应调整：

Parent(i) = floor((i-1)/2)，i 的父节点下标
Left(i) = 2i + 1，i 的左子节点下标
Right(i) = 2(i + 1)，i 的右子节点下标

下面我们一个一个地看关于堆排序的3个操作：

(1)操作一：最大堆调整（Max-Heapify），保证最大堆的性质

Java代码实现如下：

package com.ngaa.bigdata.common.utils.sort;

/**
 * Created by yangjf on 20171023.
 * Update date:
 * Time: 22:03
 * Project: ngaa-cdn-java-sdk
 * Package: com.ngaa.utils
 * Describe : 最大堆和最小堆的排序
 * 
 * Result of Test: test ok
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */
public class HeapSortUtil {
    // i节点的父亲节点下标
    private int parent(int i) {
        return (int) (Math.floor(i / 2) - 1);
    }

    // i节点的左节点下标
    private int left(int i) {
        return 2 * i + 1;
    }

    // i节点的右节点下标
    private int right(int i) {
        return 2 * (i + 1);
    }

    // 交换下标为i的元素和下标为i的数组元素的值
    private void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

    // 使以i为根的子树成为最大堆，并保持最大堆的性质
    private void maxHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点大于当前值;
        if (l < heapSize && a[l] > a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点大于最大节点值;
        if (r < heapSize && a[r] > a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最大堆的性质
            maxHeapify(a, largestIndex, heapSize);
        }
    }

    // 使以i为根的子树成为最小堆，并保持最小堆的性质
    private void minHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点小于当前值;
        if (l < heapSize && a[l] < a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点小于最大节点值;
        if (r < heapSize && a[r] < a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最小堆的性质
            minHeapify(a, largestIndex, heapSize);
        }
    }


}

(2)操作二：创建最大堆（Build-Max-Heap）

创建最大堆（Build-Max-Heap）的作用是将一个数组改造成一个最大堆，接受数组和堆大小两个参数，Build-Max-Heap 将自下而上的调用 Max-Heapify 来改造数组，建立最大堆。因为 Max-Heapify 能够保证下标 i 的结点之后结点都满足最大堆的性质，所以自下而上的调用 Max-Heapify 能够在改造过程中保持这一性质。如果最大堆的数量元素是 n，那么 Build-Max-Heap 从 Parent(n) 开始，往上依次调用 Max-Heapify。流程如下：

Java实现的代码如下：

package com.ngaa.bigdata.common.utils.sort;

/**
 * Created by yangjf on 20171023.
 * Update date:
 * Time: 22:03
 * Project: ngaa-cdn-java-sdk
 * Package: com.ngaa.utils
 * Describe : 最大堆和最小堆的排序
 * 
 * Result of Test: test ok
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */
public class HeapSortUtil {
    // i节点的父亲节点下标
    private int parent(int i) {
        return (int) (Math.floor(i / 2) - 1);
    }

    // i节点的左节点下标
    private int left(int i) {
        return 2 * i + 1;
    }

    // i节点的右节点下标
    private int right(int i) {
        return 2 * (i + 1);
    }

    // 交换下标为i的元素和下标为i的数组元素的值
    private void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

    // 使以i为根的子树成为最大堆，并保持最大堆的性质
    private void maxHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点大于当前值;
        if (l < heapSize && a[l] > a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点大于最大节点值;
        if (r < heapSize && a[r] > a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最大堆的性质
            maxHeapify(a, largestIndex, heapSize);
        }
    }

    // 使以i为根的子树成为最小堆，并保持最小堆的性质
    private void minHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点小于当前值;
        if (l < heapSize && a[l] < a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点小于最大节点值;
        if (r < heapSize && a[r] < a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最小堆的性质
            minHeapify(a, largestIndex, heapSize);
        }
    }

    // 创建最大堆
    private void buildMaxHeapify(int[] a, int heapSize) {
        int parentIndex = parent(a.length);
        for (int i = parentIndex; i >= 0; i--) {
            maxHeapify(a, i, heapSize);
        }
    }


}

(3)操作三：堆排序（Heap-Sort）

堆排序（Heap-Sort）是堆排序的接口算法，Heap-Sort先调用Build-Max-Heap将数组改造为最大堆，然后将堆顶和堆底元素交换，之后将底部上升，最后重新调用Max-Heapify保持最大堆性质。由于堆顶元素必然是堆中最大的元素，所以一次操作之后，堆中存在的最大元素被分离出堆，重复n-1次之后，数组排列完毕。整个流程如下图：

Java实现如下：

package com.ngaa.bigdata.common.utils.sort;

/**
 * Created by yangjf on 20171023.
 * Update date:
 * Time: 22:03
 * Project: ngaa-cdn-java-sdk
 * Package: com.ngaa.utils
 * Describe : 最大堆和最小堆的排序
 * 
 * Result of Test: test ok
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */
public class HeapSortUtil {
    // i节点的父亲节点下标
    private int parent(int i) {
        return (int) (Math.floor(i / 2) - 1);
    }

    // i节点的左节点下标
    private int left(int i) {
        return 2 * i + 1;
    }

    // i节点的右节点下标
    private int right(int i) {
        return 2 * (i + 1);
    }

    // 交换下标为i的元素和下标为i的数组元素的值
    private void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

    // 使以i为根的子树成为最大堆，并保持最大堆的性质
    private void maxHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点大于当前值;
        if (l < heapSize && a[l] > a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点大于最大节点值;
        if (r < heapSize && a[r] > a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最大堆的性质
            maxHeapify(a, largestIndex, heapSize);
        }
    }

    // 使以i为根的子树成为最小堆，并保持最小堆的性质
    private void minHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点小于当前值;
        if (l < heapSize && a[l] < a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点小于最大节点值;
        if (r < heapSize && a[r] < a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最小堆的性质
            minHeapify(a, largestIndex, heapSize);
        }
    }

    // 创建最大堆
    private void buildMaxHeapify(int[] a, int heapSize) {
        int parentIndex = parent(a.length);
        for (int i = parentIndex; i >= 0; i--) {
            maxHeapify(a, i, heapSize);
        }
    }

    // 创建最小堆
    private void buildMinHeapify(int[] a, int heapSize) {
        int parentIndex = parent(a.length);
        for (int i = parentIndex; i >= 0; i--) {
            minHeapify(a, i, heapSize);
        }
    }

    // 对a数组降序排序：使用最小堆
    public void heapDescSort(int[] a, int headSize) {
        buildMinHeapify(a, headSize);
        for (int i = a.length - 1; i > 0; i--) {
            swap(a, 0, i);
            headSize = headSize - 1;     // 通过减小headSize，去掉节点i
            minHeapify(a, 0, headSize);  // 还原位置，避免违反最小堆性质
        }
    }

    // 对a数组升序排序：使用最大堆
    public void heapAscSort(int[] a, int headSize) {
        buildMaxHeapify(a, headSize);
        for (int i = a.length - 1; i > 0; i--) {
            swap(a, 0, i);
            headSize = headSize - 1;     // 通过减小headSize，去掉节点i
            maxHeapify(a, 0, headSize);  // 还原位置，避免违反最大堆性质
        }
    }

}

四、堆排序的Java实现

(1)堆排序算法实现

package com.ngaa.bigdata.common.utils.sort;

/**
 * Created by yangjf on 20171023.
 * Update date:
 * Time: 22:03
 * Project: ngaa-cdn-java-sdk
 * Package: com.ngaa.utils
 * Describe : 最大堆和最小堆的排序
 * 
 * Result of Test: test ok
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */
public class HeapSortUtil {
    // i节点的父亲节点下标
    private int parent(int i) {
        return (int) (Math.floor(i / 2) - 1);
    }

    // i节点的左节点下标
    private int left(int i) {
        return 2 * i + 1;
    }

    // i节点的右节点下标
    private int right(int i) {
        return 2 * (i + 1);
    }

    // 交换下标为i的元素和下标为i的数组元素的值
    private void swap(int[] a, int i, int j) {
        int temp = a[i];
        a[i] = a[j];
        a[j] = temp;
    }

    // 使以i为根的子树成为最大堆，并保持最大堆的性质
    private void maxHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点大于当前值;
        if (l < heapSize && a[l] > a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点大于最大节点值;
        if (r < heapSize && a[r] > a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最大堆的性质
            maxHeapify(a, largestIndex, heapSize);
        }
    }

    // 使以i为根的子树成为最小堆，并保持最小堆的性质
    private void minHeapify(int[] a, int index, int heapSize) {
        int l = left(index);        // 左儿子的下标
        int r = right(index);       // 右儿子的下标
        int largestIndex;     // 最大值的下标

        //如果左儿子节点小于等于堆大小，左节点小于当前值;
        if (l < heapSize && a[l] < a[index]) {
            largestIndex = l;
        } else {
            largestIndex = index;
        }

        // 如果右儿子节点小于等于堆大小，右节点小于最大节点值;
        if (r < heapSize && a[r] < a[largestIndex]) {
            largestIndex = r;
        }

        // 如果最大值的index不等于当前根i，则交换根节点位置
        if (largestIndex != index) {
            swap(a, index, largestIndex);

            // 递归调用避免违反最小堆的性质
            minHeapify(a, largestIndex, heapSize);
        }
    }

    // 创建最大堆
    private void buildMaxHeapify(int[] a, int heapSize) {
        int parentIndex = parent(a.length);
        for (int i = parentIndex; i >= 0; i--) {
            maxHeapify(a, i, heapSize);
        }
    }

    // 创建最小堆
    private void buildMinHeapify(int[] a, int heapSize) {
        int parentIndex = parent(a.length);
        for (int i = parentIndex; i >= 0; i--) {
            minHeapify(a, i, heapSize);
        }
    }

    // 对a数组降序排序：使用最小堆
    public void heapDescSort(int[] a, int headSize) {
        buildMinHeapify(a, headSize);
        for (int i = a.length - 1; i > 0; i--) {
            swap(a, 0, i);
            headSize = headSize - 1;     // 通过减小headSize，去掉节点i
            minHeapify(a, 0, headSize);  // 还原位置，避免违反最小堆性质
        }
    }

    // 对a数组升序排序：使用最大堆
    public void heapAscSort(int[] a, int headSize) {
        buildMaxHeapify(a, headSize);
        for (int i = a.length - 1; i > 0; i--) {
            swap(a, 0, i);
            headSize = headSize - 1;     // 通过减小headSize，去掉节点i
            maxHeapify(a, 0, headSize);  // 还原位置，避免违反最大堆性质
        }
    }

}

(2)使得数组始终保持升序或者降序

package com.ngaa.bigdata.common.utils.sort;

/**
 * Created by yangjf on 20171024.
 * Update date:
 * Time: 8:46
 * Project: ngaa-cdn-java-sdk
 * Package: com.ngaa.utils
 * Describe : 找到最大堆和最小堆的排序
 * 
 * Result of Test: test ok
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */
public class FindTopNUtils {
    private static HeapSortUtil heapSortUtil = new HeapSortUtil();

    /**
     * 方法的目的：使得数组a始终保持降序排序
     *
     * @param a     堆数组:例如 a={10,9,8,7,6,5,4,3,2,1}
     * @param value 输入的值
     * @throws Exception 异常
     */
    public synchronized void findMaxTopN(int[] a, int value) throws Exception {
        try {
            int arraySize = a.length; // 数组长度
            /**
             * tmp的值可能性是
             *  (1)大于最大的元素：   tmp>heap[0]
             *  (2)处于最小和最大之间：heap[arraySize-1] a[0] || (a[arraySize - 1] < value && value < a[0])) {
                // 阶梯交换值：即将最小的值用value替换
                a[arraySize - 1] = value;
                // 保证最小堆的性质
                heapSortUtil.heapDescSort(a, arraySize);
            }


        } catch (Exception minE) {
            throw new RuntimeException(minE);
        }
    }

    /**
     * 方法的目的：使得数组a始终保持升序排序
     *
     * @param a     堆数组:例如 a={1,2,3,4,5,6,7,8}
     * @param value 输入的值
     * @throws Exception 异常
     */
    public synchronized void findMinTopN(int[] a, int value) throws Exception {
        try {
            int arraySize = a.length; // 数组长度
            /**
             * tmp的值可能性是
             *  (1)小于最小值：       tmpheap[arraySize-1](大于数组最大值)
             *
             *
             */
            if (value < a[0] || (a[0] < value && value < a[arraySize - 1])) {
                // 阶梯交换值：即将最大的值用value替换
                a[arraySize - 1] = value;
                // 保证最大堆的性质
                heapSortUtil.heapAscSort(a, arraySize);
            }
            // 为了避免数组初始时没有元素加入，需要添加：value>a[0]
            if (value > a[0] && a[0] == 0) {
                // 阶梯交换值：即将第一个元素用value替换
                a[0] = value;
                // 保证最大堆的性质
                heapSortUtil.heapAscSort(a, arraySize);
            }

        } catch (Exception maxE) {
            throw new RuntimeException(maxE);
        }
    }
}

(3)测试排序是否正常

准备一个文件：number.txt

包含的内容是1千万条随机数：

测试的Java代码如下:

package com.ngaa.bigdata.scala.test;

import com.ngaa.bigdata.common.utils.sort.FindTopNUtils;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashSet;
import java.util.Set;

/**
 * Created by yangjf on 20171020.
 * Update date:
 * Time: 13:53
 * Project: sparkmvn
 * Package: com.ngaa.bigdata.scala.core
 * Describe :
 * 
 * Result of Test: test ok,test error
 * Command:
 * 

 * Email:  [email protected]
 * Status：Using online
 * 
 * Please note:
 * Must be checked once every time you submit a configuration file is correct!
 * Data is priceless! Accidentally deleted the consequences!
 */


public class TestTopNForJava {
    public static void main(String[] args) throws IOException {
        Set set=new HashSet<>();
        set.add("domain");
        set.add("domain02");
        set.add("domain03");
        set.add("domain04");
        String [] array= set.toArray(new String[set.size()]);
        for(String ele:array){
            System.out.println(ele);
        }

    }

    //求最大的前topN个数
    static int[] findTopNMax(int topN, String filePath) throws NumberFormatException, IOException {
        File file = new File(filePath);
        int[] heap = new int[topN];  //创建长度为topN的数组

        FileReader fr = new FileReader(file);
        BufferedReader br = new BufferedReader(fr);
        String line = null;
        FindTopNUtils heapSort = new FindTopNUtils();
        int i = 0;  //初始下标为0
        while ((line = br.readLine()) != null) {
            //如果元素有值
            if (line.trim().length() > 0) {
                int tmp = Integer.
                        parseInt(line);
                try {
                    heapSort.findMaxTopN(heap, tmp);  // 获取最大的前N个数
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }
        br.close();
        fr.close();
        return heap;
    }

    //求最小的前topN个数
    static int[] findTopNMin(int topN, String filePath) throws NumberFormatException, IOException {
        File file = new File(filePath);
        int[] heap = new int[topN];  //创建长度为topN的数组

        FileReader fr = new FileReader(file);
        BufferedReader br = new BufferedReader(fr);
        String line = null;
        FindTopNUtils heapSort = new FindTopNUtils();
        int i = 0;  //初始下标为0
        while ((line = br.readLine()) != null) {
            //如果元素有值
            if (line.trim().length() > 0) {
                int tmp = Integer.
                        parseInt(line);
                try {
                    heapSort.findMinTopN(heap, tmp);    // 获取最小的前N个数
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }
        br.close();
        fr.close();
        return heap;
    }
}

五、堆排序的Scala实现

(1)堆排序算法

package com.ngaa.bigdata.common.utils.sort

/**
  * Created by yangjf on 20171030.
  * Update date:
  * Time: 10:09
  * Project: sparkmvn
  * Package: com.ngaa.bigdata.common.utils.sort
  * Describe :
  *          This class is the largest stack and the smallest heap sort for the second element of the ancestor.
  *
  * Result of Test: test ok
  * Command:
  *
  * Email:  [email protected]
  * Status：Using online
  *
  * Please note:
  * Must be checked once every time you submit a configuration file is correct!
  * Data is priceless! Accidentally deleted the consequences!
  *
  */
class SortByHeapUtils extends Serializable{

  def parent(i: Int): Int = {
     (Math.floor(i / 2) - 1).asInstanceOf[Int]
  }

  def left(i: Int): Int = {
    2 * i + 1
  }

  def right(i: Int): Int = {
    2 * (i + 1)
  }

  def swap(array: Array[(String, Long)], i: Int, j: Int): Unit = {
    val tmp = array(i)
    array(i) = array(j)
    array(j) = tmp
  }

  def minHeapify(a: Array[(String, Long)], index: Int, heapSize: Int): Any = {
    val l = left(index)
    val r = right(index)
    var largestIndex: Int = 0

    if (l < heapSize && (a(l)._2 < a(index)._2)) {
      largestIndex = l
    } else {
      largestIndex = index
    }

    if (r < heapSize && a(r)._2 < a(largestIndex)._2) {
      largestIndex = r
    }

    if (largestIndex != index) {
      swap(a, index, largestIndex)
      minHeapify(a, largestIndex, heapSize)
    }
  }

  def maxHeapify(a: Array[(String, Long)], index: Int, heapSize: Int): Any = {
    val l = left(index)
    val r = right(index)
    var largestIndex: Int = 0

    if (l < heapSize && (a(l)._2 > a(index)._2)) {
      largestIndex = l
    } else {
      largestIndex = index
    }

    if (r < heapSize && a(r)._2 > a(largestIndex)._2) {
      largestIndex = r
    }

    if (largestIndex != index) {
      swap(a, index, largestIndex)
      maxHeapify(a, largestIndex, heapSize)
    }
  }


  def buildMinHeapify(a: Array[(String, Long)], heapSize: Int): Unit = {
    val parentIndex: Int = parent(a.length)
    for (i <- parentIndex to 0 by -1) {
      minHeapify(a, i, heapSize)
    }
  }

  def buildMaxHeapify(a: Array[(String, Long)], heapSize: Int): Unit = {
    val parentIndex: Int = parent(a.length)
    for (i <- parentIndex to 0 by -1) {
      maxHeapify(a, i, heapSize)
    }
  }

  def heapDescSort(a: Array[(String, Long)], headSize: Int) {
    buildMinHeapify(a, headSize)

    var headSizeTmp = headSize
    for (i <- a.length - 1 to 0 by -1) {
      swap(a, 0, i)
      headSizeTmp -= 1
      minHeapify(a, 0, headSizeTmp)
    }
  }

  def heapAscSort(a: Array[(String, Long)], headSize: Int) {
    buildMaxHeapify(a, headSize)

    var headSizeTmp = headSize
    for (i <- a.length - 1 to 0 by -1) {
      swap(a, 0, i)
      headSizeTmp -= 1
      maxHeapify(a, 0, headSizeTmp)
    }
  }

}

(2)保持数组降序或者升序

package com.ngaa.bigdata.common.utils.sort

import com.ngaa.bigdata.common.model.global.NgaaException
import com.ngaa.bigdata.common.traits.HeapSort

/**
  * Created by yangjf on 20171030.
  * Update date:
  * Time: 11:54
  * Project: sparkmvn
  * Package: com.ngaa.bigdata.common.utils.sort
  * Describe :
  *        The Scala version looks for the largest number of N and the smallest number of N numbers in the tuple.
  *
  * Result of Test: test ok
  * Command:
  *
  * Email:  [email protected]
  * Status：Using online
  *
  * Please note:
  * Must be checked once every time you submit a configuration file is correct!
  * Data is priceless! Accidentally deleted the consequences!
  *
  */
class FindSortTopN extends HeapSort with Serializable{
  private val sortByHeapUtils = new SortByHeapUtils

  @throws(classOf[NgaaException])
  override def findMaxTopN(a: Array[(String, Long)], value: (String, Long)): Unit = {
    try {
      val arraySize: Int = a.length // 数组长度
      /**
        * tmp的值可能性是
        * (1)大于最大的元素：   tmp>heap[0]
        * (2)处于最小和最大之间：heap[arraySize-1]< tmp < heap[0]
        * (3)舍弃值：value=heap[0] 、 value=heap[arraySize-1] 和 value < heap[arraySize-1](小于最小值)
        */
      if (value._2 >= a(0)._2 || (a(arraySize - 1)._2 < value._2 && value._2 < a(0)._2)) {
        // 阶梯交换值：即将最小的值用value替换
        a(arraySize - 1) = value
        // 保证最小堆的性质
        sortByHeapUtils.heapDescSort(a, arraySize)
      }
    }
    catch {
      case minE: Exception => throw new RuntimeException(minE)
    }
  }

  @throws(classOf[NgaaException])
  override def findMinTopN(a: Array[(String, Long)], value: (String, Long)): Unit = {
    try {
      val arraySize = a.length; // 数组长度
      /**
        * tmp的值可能性是
        * (1)小于最小值：       tmpa[0]
      if (value._2 > a(0)._2 && a(0)._2 == 0) {
        // 阶梯交换值：即将第一个元素用value替换
        a(0) = value
        // 保证最大堆的性质
        sortByHeapUtils.heapAscSort(a, arraySize)
      }

    } catch {
      case maxE: Exception => throw new RuntimeException(maxE)
    }
  }

  @throws(classOf[NgaaException])
  override def initArray(array: Array[(String, Long)],initValue:(String,Long)=("init",0l)): Unit = {
   for(i <- array.indices ){
      array(i)=initValue
   }
  }
}

注：

代码中涉及的文件内容如下

package com.ngaa.bigdata.common.traits

import com.ngaa.bigdata.common.model.global.NgaaException

/**
  * Created by yangjf on 20171030.
  * Update date:
  * Time: 11:19
  * Project: sparkmvn
  * Package: com.ngaa.bigdata.common.traits
  * Describe : Heap sort interface
  *
  * Result of Test: test ok
  * Command:
  *
  * Email:  [email protected]
  * Status：Using online
  *
  * Please note:
  * Must be checked once every time you submit a configuration file is correct!
  * Data is priceless! Accidentally deleted the consequences!
  *
  */
 trait HeapSort  extends Serializable{

  /**
    *  Initialize the array
    * @param array       Input array
    * @param initValue   Init value
    * @throws com.ngaa.bigdata.common.model.global.NgaaException exception
    */
    @throws(classOf[NgaaException])
    def initArray(array:Array[(String, Long)],initValue:(String,Long)=("init",0l))

  /**
    * Discover the largest number of N numbers in the Tuple.
    * @param array Input array.
    * @param tuple Tuple
    * @throws com.ngaa.bigdata.common.model.global.NgaaException exception
    */
    @throws(classOf[NgaaException])
    def findMaxTopN(array:Array[(String, Long)],tuple:(String,Long))

  /**
    * Discover the smallest number of N numbers in the Tuple.
    * @param array Input array.
    * @param tuple Tuple
    * @throws com.ngaa.bigdata.common.model.global.NgaaException exception
    */
    @throws(classOf[NgaaException])
    def findMinTopN(array:Array[(String, Long)],tuple:(String,Long))

}

参考文章：

1、堆排序：http://student.zjzk.cn/course_ware/data_structure/web/paixu/paixu8.4.2.1.htm

2、算法-堆排序：http://ind.ntou.edu.tw/~litsnow/al98/pdf/Algorithm-Ch6-Heapsort.pdf

3、堆排序：http://www.personal.kent.edu/~rmuhamma/Algorithms/MyAlgorithms/Sorting/heapSort.htm

4、排序算法：http://www.sorting-algorithms.com/

5、计算机算法：http://www.nowamagic.net/algorithm/algorithm_HeapSortStudy.php

6、堆排序wiki：https://zh.wikipedia.org/wiki/%E5%A0%86%E6%8E%92%E5%BA%8F

你可能感兴趣的:(Java,Scala,Spark)

javaweb中@Component和@Mapper和@Service和@RestController这几个注解要加在哪?为什么? 瑞金彭于晏 maven java spring boot spring
在JavaWeb开发中特别是在使用Spring框架（包括SpringBoot）时，@Component、@Mapper、@Service、@RestController这些注解扮演着非常重要的角色，它们用于定义组件的类型，并帮助Spring框架进行自动装配和依赖注入。下面分别解释这些注解应该加在哪里以及为什么：1.@Component加在哪里：@Component可以加在任何类上，表示这个类是一个
Java Stream 去重的多种方法坎布里奇 java java python 开发语言
在JavaStream中实现去重有多种方法，具体取决于需求和场景。以下是常见的几种方法及示例：1.使用distinct()方法适用于对象已正确实现equals()和hashCode()，基于对象整体去重并保留顺序：ListuniquePersons=persons.stream().distinct().collect(Collectors.toList());2.根据对象的属性去重方法一：使用C
java数组 TwitCoder java 算法
目录一、数组概念二、数组的声明与初始化三、数组操作示例四、数组属性与注意事项五、内存结构分析六、常见操作七、二维数组八、稀疏数组一、数组概念数组是Java中用于存储相同类型数据的有序集合，具有以下特性：类型一致性：所有元素必须属于同一数据类型有序性：元素按顺序排列，通过索引访问长度固定：创建后无法改变容量二、数组的声明与初始化声明数组//推荐写法int[]numbers;初始化方式：动态初始化nu
Java开发-面试题-0014-@Component, @Controller, @Repository,@Mapper,@Service有何区别 CodeZeng1998 面试题 java 开发语言 spring boot
更多内容欢迎关注我（持续更新中，欢迎Star✨）Github：CodeZeng1998/Java-Developer-Work-Note技术公众号：CodeZeng1998（纯纯技术文）生活公众号：好锅（Lifeismorethancode）其他平台：CodeZeng1998、好锅@Component,@Controller,@Repository,@Mapper,@Service有何区别：@Co
PySpark安装及WordCount实现（基于Ubuntu） uui1885478445 ubuntu linux 运维
在Ubuntu上安装PySpark并实现WordCount，需要以下步骤：安装PySpark：安装Java：PySpark需要Java运行环境。你可以使用以下命令安装OpenJDK：sudoaptupdatesudoaptinstalldefault-jredefault-jdk安装Scala：PySpark还需要Scala，可以使用以下命令安装：sudoaptinstallscala安装Pyth
JavaScript 全面教程：从基础到高级实践幼儿园扛把子\ javascript 开发语言 ecmascript
JavaScript全面教程：从基础到高级实践目录JavaScript全面教程：从基础到高级实践2.JavaScript基础语法2.1变量与数据类型2.1.1变量声明2.1.2数据类型2.2条件语句与循环2.2.1条件语句2.2.2循环2.3函数2.3.1函数定义2.3.2参数默认值3.对象与数组3.1对象3.2数组4.高级特性与最佳实践4.1作用域与闭包4.1.1闭包示例4.2事件循环（Even
VUE前端实现防抖节流 Lodash 2501_91133275 前端 vue.js javascript
写在前面：兄弟们，我手里有个长期项目，考虑接私活的可以看看我GitHub！https://github.com/ccy-233/coder2retire方法一：采用Lodash工具库Lodash是一个一致性、[模块化]、高性能的JavaScript实用工具库。（1）采用终端导入Lodash库$npmi-gnpm$npmi--savelodash（2）应用示例：搜索框输入防抖在这个示例中，我们希望用
一篇文章带你学完Java所有的时间与日期类 MHP小喇叭 java 开发语言
目录一、传统时间与日期类1.Date类构造方法获取日期和时间信息的方法设置日期和时间信息的方法2.Calendar类主要特点和功能常用方法1.获取当前日历对象2.获取日历中的某个信息3.获取日期对象4.获取时间毫秒值5.修改日历的某个信息6.为某个信息增加或者减少值3.SimpleDateFormat类主要用途构造函数模式字符串将日期格式化成日期与时间字符串将时间毫秒值格式化成字符串解析日期示例要
IDEA Reformat Code 避免将多行参数或多行方法链调用合并成一行阿湯哥 intellij-idea java ide
在IntelliJIDEA中，如果你希望在进行代码格式化（ReformatCode）时，避免将多行参数或多行方法链调用合并成一行，可以通过以下步骤进行设置：1.打开设置在IntelliJIDEA中，点击File菜单，然后选择Settings（Windows/Linux）或Preferences（macOS）。2.进入代码格式化设置在设置窗口中，导航到Editor->CodeStyle->Java（
CVE-2017-5645(使用 docker 搭建) JM丫网络安全
介绍:是一个与ApacheLog4j2相关的安全漏洞,属于远程代码执行,它可能允许攻击者通过构造恶意的日志信息在目标系统上执行任意代码Log4j2介绍Log4j2是Apache的一个日志记录工具,属于Java应用的日志框架,它是Log4j的升级版,性能更好,功能更多.它被广泛的适用于Java应用程序中,帮助开发者记录程序运行的时候的日子信息,是Java生态系统中最重要的一个日志框架之一漏洞编号:C
【前端入门】应该了解和知道的几个国内外前端开发资源网站爱上大树的小猪前端
与大家分享一下几个国内外前端开发资源网站国际资源MDNWebDocs(MozillaDeveloperNetwork)用途：MDN是Web技术领域最全面的文档库之一，涵盖了HTML、CSS、JavaScript以及浏览器API等。链接:https://developer.mozilla.orgW3Schools用途：适合初学者学习Web技术，提供从基础到进阶的教程，同时还有在线练习环境。链接:ht
Python（1）Python全方位指南：定义、应用与零基础入门实战一个天蝎座白勺程序猿 Python入门到精通 python 开发语言
背景：为什么Python成为开发者必备技能？‌Python自1991年发布以来，凭借‌“简单高效”‌的设计理念，成为全球增长最快的编程语言。根据TIOBE2023年榜单，Python稳居前三，其核心竞争力包括：‌开发效率高‌：代码量仅为Java的1/5，C++的1/10。‌跨领域通吃‌：从Web开发到AI训练，覆盖90%以上技术场景。‌企业级应用‌：YouTube用Python处理视频推荐，NAS
IntelliJ IDEA 2023.3.1安装指南从下载到配置的完整教程（附资源下载）心灵宝贝 intellij-idea java ide
安装IntelliJIDEA2023.3.1非常简单，以下是详细的安装步骤，适用于Windows、macOS和Linux系统。1.下载IntelliJIDEAIntelliJIDEA下载链接：https://pan.quark.cn/s/3ad975664934选择适合你的操作系统的版本：Ultimate版：功能全面，支持所有开发语言和框架（需付费）。Community版：免费版，适合Java和K
计算机毕业设计springboot教务管理系统 0k1c1源码+系统+程序+lw文档+部署呦呦网络 spring boot java mysql
计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5
c++与c语言的区别是什么？ pythoncainiao221 c++c语言开发语言
1、类型不同C语言是面向过程的，而C++是面向对象的。2、函数库不同C语言的标准的函数库很松散，而C++对于大多数的函数都是集成的很紧密。3、结构不同C语言中结构只有成员变量，而在C++中结构中，可以有成员变量和成员函数。它们的区别是c++是在C语言基础上发展起来的，根据开发过程中遇到的需求，它引入了很多新的特性。如果你不走C/C++方向，直接学习Java就可以了，相同的待遇下，选择简单的更好。当
JAVASE（七）关键字this和static，类的结构详解（二）永无魇足 java java
目录一、关键字this和static1.关键字this2.关键字static二、代码块1.定义2.实例代码块和静态代码块一、关键字this和static1.关键字thisthis代表当前对象。（1）当方法里面的局部变量和成员变量同名的时候，就可以使用this。如：publicclassHuman{Stringname;Stringgender;publicHuman(Stringname,Stri
JetBrains IntelliJ IDEA 2024 for Mac v2024.3 中文 Java开发工具 Olive_Sweet java intellij-idea macos
介绍JetBrainsIntelliJIDEA2024mac，是一款Java开发工具，IntelliJIDEA凭借无与伦比的Java和Kotlin支持脱颖而出。从一开始就支持尖IDEA2024.3中文版开发工具端语言功能，保持领先地位。IntelliJIDEA对您的代码了如指掌，利用这些知识在每个上下文中提供相关建议，实现极快的导航和智能体验。效果下载百度网盘:https://pan.baidu.
02、数据结构与算法 - 基础：数组 - 吊打面试官星星学霸数据结构与算法 -吊打面试官 python 开发语言 java 算法数据结构
更多系列教程，每天更新更多教程关注：xxxueba.com星星学霸本篇博客我们介绍数据结构的鼻祖------数组，可以说数组几乎能表示一切的数据结构，在每一门编程语言中，数组都是重要的数据结构，当然每种语言对数组的实现和处理也不相同，但是本质是都是用来存放数据的的结构，这里我们以Java语言为例，来详细介绍Java语言中数组的用法。Java中数组的介绍在Java中，数组是用来存放同一种数据类型的集
Android wifi的开关Settings值异常分析峥嵘life android Android系统 Android网络 android python 开发语言
Androidwifi的开关Settings值异常分析文章目录Androidwifi的开关Settings值异常分析一、前言二、异常分析1、adb或者串口获取Settings的wifi开关值2、代码获取wifi开关值3、根据日志分析代码(1)logcat对应的wifi开启日志的代码①WifiServiceImpl.java②WifiSettingsStore.java3、wifi_on不同的具体原
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践网罗开发实战实战源码 devops 运维
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Android开源库——RxJava和RxAndroid 松仔log #Android开源库 android 开源 rxjava
RxJava和RxAndroid是什么？RxJava是基于JVM的响应式扩展，用于编写异步代码RxAndroid是关于Android的RxJava绑定RxJava和RxAndroid使用依赖implementation'io.reactivex.rxjava3:rxjava:3.1.0'implementation'io.reactivex.rxjava3:rxandroid:3.0.2'使用过程
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
kettle ETL 配置云连山数字化 etl
pdi-ce-9.1.0.0-324配置-CSDN博客3、配置中文字符3.1）spoon支持中文字符，spoon.bat启动文件加-Dfile.encoding=utf-8REM%SPOON_START_OPTION%"%_PENTAHO_JAVA%"%JAVA_ADD_OPENS%%OPT%-jarlauncher\launcher.jar-lib..\%LIBSPATH%%_cmdline%%
深度解析前端面试八股文：核心知识点与高效应对策略赵大仁前端面试职场和发展
深度解析前端面试八股文：核心知识点与高效应对策略1.引言前端面试是每位开发者迈向职业进阶的重要环节，涉及HTML、CSS、JavaScript、性能优化、浏览器原理、网络、安全、框架（Vue/React）等核心知识点。本文不仅会覆盖前端面试的高频八股文，还会结合生动的案例，让你在面试时能够脱离死记硬背，从理解中突破！2.HTML&CSS高频考点2.1HTML语义化问题：什么是HTML语义化？为什么
字符流在处理不同编码文件时的工作原理啊sen丶 java 开发语言
在Java中，字符流是专门用于处理文本数据的IO流，它基于字符（char）操作，能够自动处理字符编码的转换。字符流的核心在于它可以根据指定的字符集（如UTF-8、GBK、ISO-8859-1等）将字节数据解码为字符数据，或者将字符数据编码为字节数据。这种机制使得字符流在处理不同编码的文件时非常灵活，能够有效避免因编码不一致导致的乱码问题。一、字符流的工作原理字符流在内部使用Charset（字符集）
Java中的参数传递机制：值传递与引用传递的真相啊sen丶 java 开发语言
在Java编程中，参数传递机制是每个开发者都必须理解的基本概念之一。然而，关于Java的参数传递机制，常常存在一些误解。很多人会问：“Java是按值传递还是按引用传递？”本文将通过详细的解释和代码示例，帮助你彻底理解Java的参数传递机制。一、值传递与引用传递的基本概念（一）值传递（PassbyValue）值传递是指在调用方法时，将实际参数的值复制一份传递给方法。在方法内部对参数的修改不会影响到原
AJAX PHP：深入理解与实际应用 wjs2024 开发语言
AJAXPHP：深入理解与实际应用引言随着互联网技术的不断发展，前端与后端交互变得更加频繁。AJAX（AsynchronousJavaScriptandXML）和PHP（HypertextPreprocessor）作为两种流行的技术，在实现动态网页和应用程序方面扮演着重要角色。本文将深入探讨AJAXPHP的工作原理、应用场景以及实际开发中的注意事项。AJAXPHP概述AJAXAJAX是一种基于Ja
python代码重构技巧_Python代码重构指南，老师Bryan Beecham完结 weixin_39916479 python代码重构技巧
本套课程由BryanBeecham，全球知名敏捷开发教练主讲的：Python代码重构指南。重构是软件改进的核心，它使软件拥有更好的结构和性能，也使代码更易于理解、修改和扩展。尽管重构并不是新事物，但是软件开发人员仍然会苦恼于如何正确地进行重构。随着敏捷运动的发展，DevOps之类的概念不断追求高质量和精心设计的代码，以实现更快的部署和反馈。不过，现有的很多关于重构的教程都基于Java语言，关于Py
Spring Boot 多级缓存实战：基于 Redis+Redisson 构建高并发解决方案 Isaac_Gao 缓存 spring boot redis
SpringBoot多级缓存实战：基于Redis+Redisson构建高并发解决方案本文适合人群：中高级Java开发工程师、系统架构师、对高并发场景优化感兴趣的技术人员一、为什么需要多级缓存？在百万级并发的电商系统中，我们曾遇到这样的性能瓶颈：本地缓存导致各节点数据不一致单纯依赖Redis造成带宽瓶颈缓存雪崩导致DB被打挂多级缓存架构通过结合本地缓存与分布式缓存的优势，实现了：热点数据纳秒级访问分
Java代码优化提升系统性能种豆走天下 java 开发语言
优化可以涉及许多方面，例如算法优化、内存管理、线程管理、I/O性能等。以下是一些常见的优化建议和技巧：1.优化算法和数据结构选择合适的算法：优化性能的首要步骤是选择正确的算法。例如，使用二分查找代替线性查找，或者使用合适的排序算法来替代简单的冒泡排序。选择合适的数据结构：数据结构的选择对系统的性能有很大影响。例如，如果需要频繁的插入和删除操作，使用LinkedList而不是ArrayList可能会
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟