m0_37158039

huffman编码

1.感谢：

Java读写二进制文件操作

2.简介

这是学校课程的一个实验题目。我们先看看题目吧：

以字母(Character)为基础的压缩

文本解析：将cacm.all文件分解成一个个的字母
字频统计：统计每个字母出现的词频
Huffman编码：根据Huffman编码的原理，对每个字母进行编码。给出一个编码字典。
文档压缩：根据Huffman编码，压缩文件。
文档还原：对压缩后的文档进行解压缩。

Huffman，首先要理解的是Huffman树，额这个参考一下： huffman编码实现（详细实现）

然后，我们知道，压缩应该这样做：

1.读取文件，统计字符的频率/权重
2.根据字符的频率/权重生成一棵Huffman树，然后就得到了所谓的字符编码，0101，一寸二进制。根据这个字符编码，我们就可以把文件中的每一个字符编成二进制！例如，源文件的字符“a"，其字典是01，那么，以后文件中的a都用01代替！这样就构造了一个映射了，爽歪歪！
3.再读取源文件，根据字符字典，写入一个二进制文件中，完成！

看起来，还挺简单的，嗯，然后我们看看一些有坑的地方，和关键代码实现。

3.首先，我们来定义Huffman的结点类：

这里，还实现了一个

/**
 * Created by Chestnut on 2016/11/6.
 *  实现Comparable接口，使用优先队列
 *      默认的优先队列是优先级最高的先push
 *      而这里，我们需要：优先级（权重）
 *      最小的先push.
 */
public class HufNode<A> implements Comparable<HufNode>{

    private HufNode leftChild = null;   //左孩子
    private HufNode rightChild = null;  //右孩子
    private int weight = 0;             //频率/权重
    private A object = null;            //结点存储的对象，如果没有，约定为空。

    public HufNode(HufNode leftChild, HufNode rightChild, int weight, A object) {
        this.leftChild = leftChild;
        this.rightChild = rightChild;
        this.weight = weight;
        this.object = object;
    }

    public HufNode getLeftChild() {
        return leftChild;
    }

    public void setLeftChild(HufNode leftChild) {
        this.leftChild = leftChild;
    }

    public HufNode getRightChild() {
        return rightChild;
    }

    public void setRightChild(HufNode rightChild) {
        this.rightChild = rightChild;
    }

    public int getWeight() {
        return weight;
    }

    public void setWeight(int weight) {
        this.weight = weight;
    }

    public A getObject() {
        return object;
    }

    public void setObject(A object) {
        this.object = object;
    }

    @Override
    public int compareTo(HufNode o) {
        if (this.weight < o.weight)
            return -1;
        else if (this.weight > o.weight)
            return 1;
        else
            return 0;
    }
}

4 .文件的字符统计

这个实现起来，还挺简单。
注意FileReader，其实用来读取文件内容，
当读到文件尾的时候，fileReader.read()返回-1.

/**
     * 根据文件路径返回 Huffman 节点集合
     * @param filePath
     * @return
     */
    public static List getHuffNodes(String filePath) {
        List characters = null;
        List hufNodes = null;
        try(
                FileReader fileReader = new FileReader(filePath)
        ){
            hufNodes = new ArrayList<>();
            characters = new ArrayList<>();
            int ch ;
            while ((ch = fileReader.read())!=-1) {

                char temp = (char) ch;

                if (!characters.contains(temp)) {
                    characters.add(temp);
                    HufNode hufNode = new HufNode<>(null,null,1,temp);
                    hufNodes.add(hufNode);
                }
                else {
                    int index = characters.indexOf(temp);
                    int weight = hufNodes.get(index).getWeight();
                    hufNodes.get(index).setWeight(++weight);
                }
            }

        } catch (FileNotFoundException e) {
            e.printStackTrace();
            System.out.println("FileNotFoundException:"+e.getMessage());
        } catch (IOException e) {
            e.printStackTrace();
            System.out.println("IOException:"+e.getMessage());
        }
        return hufNodes;
    }

这里要非常注意，FileReader的用法。
例如，当向文件写入：int -1，那么，实际上，
用二进制看文件，会发现：FF FF FF FF
嗯，很对，int型是32位，转成16进制就是8位了，而，-1的16进制就是：FF FF FF FF。
使用fileReader.read()的话，按照Ascii码返回！
也就是说，这里去read的话，不会返回-1，返回的是65535！

5.然后就是建立Huffman树了...

/**
     * 构造Huffman树
     *      约定：左子树 <= 右子树
     * @param hufNodes 传入乱序的所有原始数据
     * @return  Huffman的头
     */
    public static HufNode buildHuffTree(List hufNodes) {
        PriorityQueue priorities = new PriorityQueue<>();
        priorities.addAll(hufNodes);

        HufNode New;
        for (int i = 0; i < hufNodes.size() - 1; i++) {
            HufNode a = priorities.poll();
            HufNode b = priorities.poll();
            New = new HufNode(a,b,a.getWeight()+b.getWeight(),null);
            if (priorities.isEmpty())
                return New;
            priorities.add(New);
        }
        return null;
    }

这里传入的是乱序的原始结点。这里就通过一个优先队列去排序。
优先队列：java中原本的实现，是按照插入队列中的数据中的权值，由小到大poll出来。
这里是不是有点符合我们的Huffman树的构造了，把权重最大的放在离root节点最近。
所以，这里的HuffmanNode类就实现了一个优先队列的排序接口。

6 .得到字符字典/字符编码

    /**
     * 得到编码字典
     * @param rootNode  根节点
     * @return  编码
     */
    public static Map getLetterCode(HufNode rootNode) {
        Map letterCode = new HashMap();
        getLetterCode(rootNode, "", letterCode);
        return letterCode;
    }

    /**
     * 先序遍历哈夫曼树,获得所有字符编码对。
     * @param rooNode 哈夫曼树根结点
     * @param suffix 编码前缀，也就是编码这个字符时，之前路径上的所有编码
     * @param letterCode 用于保存字符编码结果
     */
    private static void getLetterCode(HufNode rooNode, String suffix, Map letterCode) {
        if (rooNode != null) {
            if (rooNode.getLeftChild() == null && rooNode.getRightChild() == null) {
                Character character = (Character) rooNode.getObject();
                letterCode.put(character, suffix);

            }
            getLetterCode(rooNode.getLeftChild(), suffix + "0", letterCode);
            getLetterCode(rooNode.getRightChild(), suffix + "1", letterCode);
        }
    }

核心思想就是，先序遍历！很熟悉呐，套路的递归。

7 .编码压缩

根据编码去重新读取源文件的每一个字符，再存入新的文件，以0101的形式，也就是二进制。
这里，我们要考虑几个问题：

(1) .文件的后缀
(2) .文件的字符字典
(3) .文件的末尾

java中的二进制读写，是一定要用：DataInputStream && DataOutputStream
这里，我是这样约定的，
先存文件的后缀，然后是字符字典，最后是正文。
正文中，0101流按照由（int）高位到地址存放。
而且，为了标记是当前的内容是文件的后缀，还是字符字典，还是文件末尾，我把int的最高位
也就是符号位不作为正文的使用。
约定如下：

/**
 * Created by Chestnut on 2016/11/6.
 *
 *  在这里定义编码的格式如下：
 *
 *      (这里，约定使用int的31位，最高位为0)
 *      (最高位为1，即符号标志位为1的，约定为一些敏感字段的头和尾)
 *
 *     [int:-1] 文件头（包含一些文件信息，例如后缀等等）
 *              [int:-10] 文件后缀(一个int)
 *                  [int:一个int]
 *                          unknown:0（没约定）
 *                          txt : 1
 *                          jpg : 2
 *                          ...（需要约定）
 *     [int:-1]
 *
 *     [int:-2] 字符字典：
 *              [int:] （这个为字符！），为16进制！应该解析为字符。
 *              [int:]...（字符的频率/权重：）
 *              ...
 *     [int:-2]
 *
 *     [int:-3] 编码区
 *              [int:] n个int,为正数，最高位为0。
 *              ...
 *              ...
 *              ...
 *              [int:-301] 说明下一个是最后一个int的开始。
 *              [int:] 说明剩下的bit数
 *                  [int:]...数据
 *     [int:-3]
 *
 *
 */

这里的字符字典我使用的是字符的权重去存储，
其实这也可以压缩一下，存储0101.
然后，根据这个约定，我们就可以去压缩了。
在这之前，放出几个必要的函数：

    /**
     * 从int获取第index位bit(0/1)
     * @param a int
     * @param index  位置，1-32
     * @return 0/1 char
     */
    public static char getBitFromInt(int a, int index) {
        if (index<0 || index>32)
            return '0';
        return (a>>index-1 & 0x00000001) == 1 ? '1' : '0';
    }

    /**
     * 把bit写入到int里面
     * @param a     int
     * @param bit   位，只能是'1' or '0'
     * @param index 位置，1-32
     */
    public static int writeBitToInt(int a,char bit,int index) {
        if (bit=='0' || index<0 || index>32)
            return a;
        return 1<1 | a;
    }

    /**
     * 根据letterCode和字符取得编码字典
     * @param letterCode
     * @param c
     * @return
     */
    public static String getEncodeFromOneChar(Map letterCode, char c) {
        Set set = letterCode.keySet();
        if (set.contains(c)) {
            return letterCode.get(c);
        }
        return "";
    }

这几个都是读写int型数据的bit位。（为啥要这么蛋疼？一位一位bit写不可以吗？不可以，java不支持...）
压缩的代码：

/**
     * 编码
     * @param src       源文件地址
     * @param encode    编码到哪个文件
     * @param letterCode 字符字典
     * @param hufNodes 最原始的带有字符频率的Huffman结点
     * @return 是否成功
     */
    public static boolean encode(String src, String encode, Map letterCode, List hufNodes) {

        //取得后缀名
        String suffix = src.substring(src.lastIndexOf(".")+1);
        int suffixCode = 0;
        switch (suffix) {
            case "txt":
                suffixCode = 1;
                break;
            case "jpg":
                suffixCode = 2;
                break;
        }

        try(
                DataOutputStream writer = new DataOutputStream(new FileOutputStream(encode));
                FileReader reader = new FileReader(src)
        ) {
            //  [int:-1] 文件头（包含一些文件信息，例如后缀等等）
            //           [int:-10] 文件后缀(一个int)
            //                      [int:一个int]
            //                       unknown:0（没约定）
            //                       txt : 1
            //                       jpg : 2
            //                       ...（需要约定）
            //  [int:-1]
            writer.writeInt(-1);
            writer.writeInt(-10);
            writer.writeInt(suffixCode);
            writer.writeInt(-1);

            //  [int:-2] 字符字典：
            //           [int:] （这个为字符！），为16进制！应该解析为字符。
            //           [int:]...（字符的频率/权重：）
            //           ...
            //  [int:-2]
            writer.writeInt(-2);
            for (int i = 0; i < hufNodes.size(); i++) {
                writer.writeInt((Character)hufNodes.get(i).getObject());
                writer.writeInt(hufNodes.get(i).getWeight());
            }
            writer.writeInt(-2);

            //  [int:-3] 编码区
            //           [int:] n个int,为正数，最高位为0。
            //           ...
            //           ...
            //           ...
            //           [int:-301] 说明下一个是最后一个int的开始。
            //           [int:] 说明剩下的bit数
            //              [int:]...数据
            //  [int:-3]
            writer.writeInt(-3);
            int ch ;
            ArrayBlockingQueue arrayBlockingQueue = new ArrayBlockingQueue<>(100);
            String xxx ;
            while ((ch = reader.read())!=-1) {
                char ii = (char) ch;
                xxx = getEncodeFromOneChar(letterCode, ii);
                for (int i = 0; i < xxx.length(); i++) {
                    arrayBlockingQueue.add(xxx.charAt(i));
                    if (arrayBlockingQueue.size()>=31) {
                        int pp = 0;
                        for (int j = 0; j < 31; j++) {
                            pp =  writeBitToInt(pp,arrayBlockingQueue.poll(),31-j);
                        }
                        pp = writeBitToInt(pp,'0',32);
                        writer.writeInt(pp);
                    }
                }
            }
            if (!arrayBlockingQueue.isEmpty()) {
                writer.writeInt(-301);
                writer.writeInt(arrayBlockingQueue.size());
                int pp = 0;
                int length = arrayBlockingQueue.size();
                for (int i = 0; i < length; i++) {
                    pp =  writeBitToInt(pp,arrayBlockingQueue.poll(),length-i);
                }
                writer.writeInt(pp);
            } else {
                writer.writeInt(-301);
                writer.writeInt(0);
            }
            writer.writeInt(-3);
            return true;
        } catch (IOException e) {
            File file = new File(encode);
            if (file.exists())
                file.delete();
            e.printStackTrace();
            return false;
        }
    }

仔细看看注释应该可以懂，不懂再问我哈。

8 .解码解压

清楚了上面的压缩编码，解码就很容易：

/**
     * 解码
     * @param src   待解码文件
     * @param decodeFilePath 解压的路径，注意，其是一个路径而不是一个文件。
     * @return  是否成功
     */
    public static boolean decode(String src, String decodeFilePath) {

        File file = new File(src);
        if (!file.exists()) return false;

        try (
                DataInputStream in = new DataInputStream(
                        new BufferedInputStream(
                                new FileInputStream(src)))
        ){
            int temp;

            //[-1]读取文件头
            temp = in.readInt();
            if (temp!=-1) return false;
            while ((temp = in.readInt())!=-1) {
                //读取自定义的信息
                switch (temp) {
                    case -10://后缀
                        String suffix;
                        switch (in.readInt()) {
                            case 1:
                                suffix = ".txt";
                                break;
                            case 2:
                                suffix = ".jpg";
                                break;
                            default:
                                suffix = ".unknown";
                                break;
                        }
                        decodeFilePath += "temp" + suffix;
                        break;
                }
            }

            //[-2]读取字符频率/权重
            temp = in.readInt();
            if (temp!=-2) return false;
            List hufNodes = new ArrayList<>();
            while ((temp = in.readInt())!=-2) {
                //读取字符
                char a = (char) temp;
                int weight = in.readInt();
                hufNodes.add(new HufNode<>(null,null,weight,a));
            }
            //建立Huffman树
            HufNode root = buildHuffTree(hufNodes);

            try(
                    DataOutputStream writer = new DataOutputStream(new FileOutputStream(decodeFilePath))
            ) {
                //[-3]读取编码 & 写入文件
                HufNode point = root;
                temp = in.readInt();
                if (temp!=-3) return false;
                while ((temp = in.readInt())!=-3) {
                    switch (temp) {
                        case -301://到最后一个int
                            int lastIntLength = in.readInt();
                            temp = in.readInt();
                            //读取 & 写入
                            for (int i = 0; i < lastIntLength; i++) {
                                point = getBitFromInt(temp,lastIntLength-i) == '1' ? point.getRightChild() : point.getLeftChild();
                                if (point.getObject()!=null) {
                                    writer.write(point.getObject());
                                    point = root;
                                }
                            }
                            break;
                        default:
                            //读取 & 写入
                            for (int i = 0; i < 31; i++) {
                                point = getBitFromInt(temp,31-i) == '1' ? point.getRightChild() : point.getLeftChild();
                                if (point.getObject()!=null) {
                                    writer.write(point.getObject());
                                    point = root;
                                }
                            }
                            break;
                    }
                }
            }catch (Exception e) {
                e.printStackTrace();
                return false;
            }
        }catch (Exception e) {
            e.printStackTrace();
            return false;
        }
        return true;
    }

9 .组合的一个工具类：HuffmanUtils

package Lab5;

import java.io.*;
import java.util.*;
import java.util.concurrent.ArrayBlockingQueue;

/**
 * Created by Chestnut on 2016/11/6.
 *
 *  在这里定义编码的格式如下：
 *
 *      (这里，约定使用int的31位，最高位为0)
 *      (最高位为1，即符号标志位为1的，约定为一些敏感字段的头和尾)
 *
 *     [int:-1] 文件头（包含一些文件信息，例如后缀等等）
 *              [int:-10] 文件后缀(一个int)
 *                  [int:一个int]
 *                          unknown:0（没约定）
 *                          txt : 1
 *                          jpg : 2
 *                          ...（需要约定）
 *     [int:-1]
 *
 *     [int:-2] 字符字典：
 *              [int:] （这个为字符！），为16进制！应该解析为字符。
 *              [int:]...（字符的频率/权重：）
 *              ...
 *     [int:-2]
 *
 *     [int:-3] 编码区
 *              [int:] n个int,为正数，最高位为0。
 *              ...
 *              ...
 *              ...
 *              [int:-301] 说明下一个是最后一个int的开始。
 *              [int:] 说明剩下的bit数
 *                  [int:]...数据
 *     [int:-3]
 *
 *
 */
public class HuffmanUtils {

    /**
     * 从int获取第index位bit(0/1)
     * @param a int
     * @param index  位置，1-32
     * @return 0/1 char
     */
    public static char getBitFromInt(int a, int index) {
        if (index<0 || index>32)
            return '0';
        return (a>>index-1 & 0x00000001) == 1 ? '1' : '0';
    }

    /**
     * 把bit写入到int里面
     * @param a     int
     * @param bit   位，只能是'1' or '0'
     * @param index 位置，1-32
     */
    public static int writeBitToInt(int a,char bit,int index) {
        if (bit=='0' || index<0 || index>32)
            return a;
        return 1<1 | a;
    }

    /**
     * 根据letterCode和字符取得编码字典
     * @param letterCode
     * @param c
     * @return
     */
    public static String getEncodeFromOneChar(Map letterCode, char c) {
        Set set = letterCode.keySet();
        if (set.contains(c)) {
            return letterCode.get(c);
        }
        return "";
    }

    /**
     * 得到编码字典
     * @param rootNode  根节点
     * @return  编码
     */
    public static Map getLetterCode(HufNode rootNode) {
        Map letterCode = new HashMap();
        getLetterCode(rootNode, "", letterCode);
        return letterCode;
    }

    /**
     * 先序遍历哈夫曼树,获得所有字符编码对。
     * @param rooNode 哈夫曼树根结点
     * @param suffix 编码前缀，也就是编码这个字符时，之前路径上的所有编码
     * @param letterCode 用于保存字符编码结果
     */
    private static void getLetterCode(HufNode rooNode, String suffix, Map letterCode) {
        if (rooNode != null) {
            if (rooNode.getLeftChild() == null && rooNode.getRightChild() == null) {
                Character character = (Character) rooNode.getObject();
                letterCode.put(character, suffix);

            }
            getLetterCode(rooNode.getLeftChild(), suffix + "0", letterCode);
            getLetterCode(rooNode.getRightChild(), suffix + "1", letterCode);
        }
    }

    /**
     * 构造Huffman树
     *      约定：左子树 <= 右子树
     * @param hufNodes 传入乱序的所有原始数据
     * @return  Huffman的头
     */
    public static HufNode buildHuffTree(List hufNodes) {
        PriorityQueue priorities = new PriorityQueue<>();
        priorities.addAll(hufNodes);

        HufNode New;
        for (int i = 0; i < hufNodes.size() - 1; i++) {
            HufNode a = priorities.poll();
            HufNode b = priorities.poll();
            New = new HufNode(a,b,a.getWeight()+b.getWeight(),null);
            if (priorities.isEmpty())
                return New;
            priorities.add(New);
        }
        return null;
    }

    /**
     * 编码
     * @param src       源文件地址
     * @param encode    编码到哪个文件
     * @param letterCode 字符字典
     * @param hufNodes 最原始的带有字符频率的Huffman结点
     * @return 是否成功
     */
    public static boolean encode(String src, String encode, Map letterCode, List hufNodes) {

        //取得后缀名
        String suffix = src.substring(src.lastIndexOf(".")+1);
        int suffixCode = 0;
        switch (suffix) {
            case "txt":
                suffixCode = 1;
                break;
            case "jpg":
                suffixCode = 2;
                break;
        }

        try(
                DataOutputStream writer = new DataOutputStream(new FileOutputStream(encode));
                FileReader reader = new FileReader(src)
        ) {
            //  [int:-1] 文件头（包含一些文件信息，例如后缀等等）
            //           [int:-10] 文件后缀(一个int)
            //                      [int:一个int]
            //                       unknown:0（没约定）
            //                       txt : 1
            //                       jpg : 2
            //                       ...（需要约定）
            //  [int:-1]
            writer.writeInt(-1);
            writer.writeInt(-10);
            writer.writeInt(suffixCode);
            writer.writeInt(-1);

            //  [int:-2] 字符字典：
            //           [int:] （这个为字符！），为16进制！应该解析为字符。
            //           [int:]...（字符的频率/权重：）
            //           ...
            //  [int:-2]
            writer.writeInt(-2);
            for (int i = 0; i < hufNodes.size(); i++) {
                writer.writeInt((Character)hufNodes.get(i).getObject());
                writer.writeInt(hufNodes.get(i).getWeight());
            }
            writer.writeInt(-2);

            //  [int:-3] 编码区
            //           [int:] n个int,为正数，最高位为0。
            //           ...
            //           ...
            //           ...
            //           [int:-301] 说明下一个是最后一个int的开始。
            //           [int:] 说明剩下的bit数
            //              [int:]...数据
            //  [int:-3]
            writer.writeInt(-3);
            int ch ;
            ArrayBlockingQueue arrayBlockingQueue = new ArrayBlockingQueue<>(100);
            String xxx ;
            while ((ch = reader.read())!=-1) {
                char ii = (char) ch;
                xxx = getEncodeFromOneChar(letterCode, ii);
                for (int i = 0; i < xxx.length(); i++) {
                    arrayBlockingQueue.add(xxx.charAt(i));
                    if (arrayBlockingQueue.size()>=31) {
                        int pp = 0;
                        for (int j = 0; j < 31; j++) {
                            pp =  writeBitToInt(pp,arrayBlockingQueue.poll(),31-j);
                        }
                        pp = writeBitToInt(pp,'0',32);
                        writer.writeInt(pp);
                    }
                }
            }
            if (!arrayBlockingQueue.isEmpty()) {
                writer.writeInt(-301);
                writer.writeInt(arrayBlockingQueue.size());
                int pp = 0;
                int length = arrayBlockingQueue.size();
                for (int i = 0; i < length; i++) {
                    pp =  writeBitToInt(pp,arrayBlockingQueue.poll(),length-i);
                }
                writer.writeInt(pp);
            } else {
                writer.writeInt(-301);
                writer.writeInt(0);
            }
            writer.writeInt(-3);
            return true;
        } catch (IOException e) {
            File file = new File(encode);
            if (file.exists())
                file.delete();
            e.printStackTrace();
            return false;
        }
    }

    /**
     * 解码
     * @param src   待解码文件
     * @param decodeFilePath 解压的路径，注意，其是一个路径而不是一个文件。
     * @return  是否成功
     */
    public static boolean decode(String src, String decodeFilePath) {

        File file = new File(src);
        if (!file.exists()) return false;

        try (
                DataInputStream in = new DataInputStream(
                        new BufferedInputStream(
                                new FileInputStream(src)))
        ){
            int temp;

            //[-1]读取文件头
            temp = in.readInt();
            if (temp!=-1) return false;
            while ((temp = in.readInt())!=-1) {
                //读取自定义的信息
                switch (temp) {
                    case -10://后缀
                        String suffix;
                        switch (in.readInt()) {
                            case 1:
                                suffix = ".txt";
                                break;
                            case 2:
                                suffix = ".jpg";
                                break;
                            default:
                                suffix = ".unknown";
                                break;
                        }
                        decodeFilePath += "temp" + suffix;
                        break;
                }
            }

            //[-2]读取字符频率/权重
            temp = in.readInt();
            if (temp!=-2) return false;
            List hufNodes = new ArrayList<>();
            while ((temp = in.readInt())!=-2) {
                //读取字符
                char a = (char) temp;
                int weight = in.readInt();
                hufNodes.add(new HufNode<>(null,null,weight,a));
            }
            //建立Huffman树
            HufNode root = buildHuffTree(hufNodes);

            try(
                    DataOutputStream writer = new DataOutputStream(new FileOutputStream(decodeFilePath))
            ) {
                //[-3]读取编码 & 写入文件
                HufNode point = root;
                temp = in.readInt();
                if (temp!=-3) return false;
                while ((temp = in.readInt())!=-3) {
                    switch (temp) {
                        case -301://到最后一个int
                            int lastIntLength = in.readInt();
                            temp = in.readInt();
                            //读取 & 写入
                            for (int i = 0; i < lastIntLength; i++) {
                                point = getBitFromInt(temp,lastIntLength-i) == '1' ? point.getRightChild() : point.getLeftChild();
                                if (point.getObject()!=null) {
                                    writer.write(point.getObject());
                                    point = root;
                                }
                            }
                            break;
                        default:
                            //读取 & 写入
                            for (int i = 0; i < 31; i++) {
                                point = getBitFromInt(temp,31-i) == '1' ? point.getRightChild() : point.getLeftChild();
                                if (point.getObject()!=null) {
                                    writer.write(point.getObject());
                                    point = root;
                                }
                            }
                            break;
                    }
                }
            }catch (Exception e) {
                e.printStackTrace();
                return false;
            }
        }catch (Exception e) {
            e.printStackTrace();
            return false;
        }
        return true;
    }

    /**
     * 根据文件路径返回 Huffman 节点集合
     * @param filePath
     * @return
     */
    public static List getHuffNodes(String filePath) {
        List characters = null;
        List hufNodes = null;
        try(
                FileReader fileReader = new FileReader(filePath)
        ){
            hufNodes = new ArrayList<>();
            characters = new ArrayList<>();
            int ch ;
            while ((ch = fileReader.read())!=-1) {

                char temp = (char) ch;

                if (!characters.contains(temp)) {
                    characters.add(temp);
                    HufNode hufNode = new HufNode<>(null,null,1,temp);
                    hufNodes.add(hufNode);
                }
                else {
                    int index = characters.indexOf(temp);
                    int weight = hufNodes.get(index).getWeight();
                    hufNodes.get(index).setWeight(++weight);
                }
            }

        } catch (FileNotFoundException e) {
            e.printStackTrace();
            System.out.println("FileNotFoundException:"+e.getMessage());
        } catch (IOException e) {
            e.printStackTrace();
            System.out.println("IOException:"+e.getMessage());
        }
        return hufNodes;
    }
}

工具类的使用：

public static void main(String[] args) {

        //从给出的文件得到字符的频率：建立起Huffman节点集合。
        List hufNodes = HuffmanUtils.getHuffNodes(FilePath);
        //建立Huffman树
        HufNode root = HuffmanUtils.buildHuffTree(hufNodes);
        //得到编码字典
        Map letterCode = HuffmanUtils.getLetterCode(root);

        //编码压缩：
        if (HuffmanUtils.encode(FilePath,FilePathEncode,letterCode,hufNodes)) {
            if (!HuffmanUtils.decode(FilePathEncode,decodeFilePath))
                System.out.println("解码失败！");
        }
        else
            System.out.println("压缩失败！");

    }

10 .总结

整个做下来，坑啊，自己知道，我的坑也不一定是你的坑，哈哈，所以，慢慢弄咯。
最后的压缩率（压缩的文件大小/压缩前的大小）为68%左右。

作者：栗子酱油饼
链接：http://www.jianshu.com/p/a30953ab62a6
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
嵌入式单片机中数码管基本实现方法嵌入式开发星球单片机项目实战操作之优秀单片机
1.点亮数码管本节课利用已经学习的LED知识去控制一个8位数码管。本节的原理比较简单。不需要多少时间讲。更多时间是跟大家一起编码调试，从中学习一些编码思路和学习方法。1.1.什么是数码管数码管是什么？下图就是一个数码管从硬件上个看，其实就是8个LED组合在一起。8个LED应该有16个引脚，但是数码管上只有10个引脚。为什么呢？请看下图：1个LED有两个引脚，要控制LED，1个引脚接控制信号，另外一
后端开发刷题 | 把数字翻译成字符串（动态规划） jingling555 笔试题目动态规划 java 算法数据结构后端
描述有一种将字母编码成数字的方式：'a'->1,'b->2',...,'z->26'。现在给一串数字，返回有多少种可能的译码结果数据范围：字符串长度满足0=10&&num<=26){if(i==1){dp[i]+=1;}else{dp[i]+=dp[i-2];}}}returndp[nums.length()-1];}}
Windows安装ciphey编码工具，附一道ciscn编码题例 im-Miclelson CTF工具网络安全
TA是什么一款智能化的编码分析解码工具，对于CTF中复杂性编码类题目可以快速攻破。编码自动分析解码的神器。如何安装Windows环境Python3.864位（最新的版本不兼容，32位的也不行）PIP直接安装pipinstallciphey-ihttps://pypi.mirrors.ustc.edu.cn/simple/安装后若是出现报错请根据错误代码行数找到对应文件，r修改成rb即可。使用标准语
2. 变量和指令（omron 机器自动化控制器）——2 一半不眠次日si记 OMRON NJ/NX系列PLC 指令基准手册自动化运维
机器自动化控制器——第二章变量和指令22-2指令一览通用指令轴指令轴组指令2-3PDO映射必需对象▶伺服轴▶编码器轴不同指令的设定对象▶伺服轴▶编码器轴2-2指令一览运动控制指令分为以下3种。种类概要通用指令MC功能模块通用指令轴指令MC功能模块执行单轴控制的指令轴组指令MC功能模块执行多轴协调控制的指令通用指令的详情参阅“第5章通用指令”，轴指令的详情参阅“第3章轴指令”，轴组的详情参阅“第4章
算法笔试-编程练习-好题-05 Glen 997 大厂校招-编程集训算法动态规划双指针
【题目类型：动规+双指针】题目内容有N个基站采用链式组网，按照从左到右编码为1到N编号。已知定义“业务”概念为三元组(基站起始编号，基站结束编号，利润)，意味着需要占据基站起始编号到基站结束编号的所有基站，打通信号流，可以获得对应利润。现在外部存在多个“业务"需求待接纳，但基站使用具有排他性，也就是说一旦某一个业务占据某个基站，其他业务不可以再使用此基站。那么接纳哪些业务需求，可以使得利润最大化?
python使用MD5 18.程序员哈希算法算法
一、要使用Python进行MD5加密，可以使用Python标准库中的hashlib模块。二、案例importhashlibstring="Hello,World!"#要进行加密的字符串hash_object=hashlib.md5(string.encode())#将字符串编码并进行MD5加密hash_hex=hash_object.hexdigest()#获取加密后的十六进制字符串print(h
Java字符串为何是不可变的？木南曌 Java java
Java中字符串是一个非常常用的数据类型，它不仅在日常编码中频繁使用，也是面试中常见的考点之一。一个经常被讨论的话题是Java中的字符串为何是不可变的。本文将探讨这个问题，并解释其背后的原因。引言在Java中，字符串是通过String类来表示的，这个类有一个很重要的特性，那就是不可变性（Immutability）。这意味着一旦一个字符串对象被创建，它的值就不能被更改。例如，当你试图修改一个字符串时
CTF-bugku-crypto-[7+1+0]-base64解码之后做偏移沧海一粟日尽其用算法安全 python
CTF-bugku-crypto-[7+1+0]-base64解码之后做偏移1.题目2.解题思路2.1base64编码原理2.2解题思路2.2.1base64解码找规律2.2.2破解思路3.解题脚本4.flag5.附EASCII码表1.题目提示信息：7+1+0？格式bugku{xxxxx}密文：4nXna/V7t2LpdLI44mn0fQ==要求：破解密文获得flag2.解题思路2.1base64
CTF常见编码及加解密（超全）第二篇不会代码的小徐编码密码网络安全密码学预编码
HTML实体编码简述：字符实体是用一个编号写入HTML代码中来代替一个字符，在使用浏览器访问网页时会将这个编号解析还原为字符以供阅读。举例：highlighter-HTML明文：hello，world.十进制：hello，world.十六进制：hel
1-1.Jetpack 之 Navigation 简单编码模板我命由我12345 Android -Jetpack 简化编程 java java-ee android-studio android studio 安卓 android jetpack
一、Navigation1、Navigation概述Navigation是Jetpack中的一个重要成员，它主要是结合导航图（NavigationGraph）来控制和简化Fragment之间的导航，即往哪里走，该怎么走2、Navigate引入在模块级build.gradle中引入相关依赖implementation'androidx.navigation:navigation-fragment:2
HTTP 请求处理的完整流程到Servlet流程图烟雨国度 http servlet 流程图
HTTP请求处理的完整流程。从TCP三次握手开始，一直到Servlet处理请求并返回响应。首先，让我解释一下response.setContentType("text/html;charset=UTF-8");这行代码：这行代码设置了HTTP响应的Content-Type头。它告诉浏览器：响应的内容类型是HTML(text/html)字符编码是UTF-8(charset=UTF-8)这样浏览器就知
HTML添加文字若无心_. HTML html5
一、创建HTML5文档基本标签//定义文档类型//定义HTML文档//定义关于文档的信息文档标题//定义文档的标题//定义文档的字符编码//定义文档的主体二、文字相关标签1.标题文字-标签可定义标题。定义最大的标题。定义最小的标题。Document这是标题1这是标题2这是标题3这是标题4这是标题5这是标题62.文本段落Document这次会晤的主题是“金砖国家在非洲：在第四次工业革命中共谋包容增长
PIPE接口奥特曼升级打怪兽网络 macos
nameDeswidthpipe的数据位宽2’b00：8bits（10bits）2’b01：16bits(20bits)2’b11:32bits(40bits)2’b11:保留(80bits)8/10b编码（128/130b编码）data并行数据（加扰）datak指示data为控制字符（gen1/gen2）valid有效接收/输出，表明data、datak上的Symbollock和有效数据data
【python】爬取网站数据进击的C语言网络
编码问题因为涉及到中文，所以必然地涉及到了编码的问题，这一次借这个机会算是彻底搞清楚了。问题要从文字的编码讲起。原本的英文编码只有0~255，刚好是8位1个字节。为了表示各种不同的语言，自然要进行扩充。中文的话有GB系列。可能还听说过Unicode和UTF-8，那么，它们之间是什么关系呢？Unicode是一种编码方案，又称万国码，可见其包含之广。但是具体存储到计算机上，并不用这种编码，可以说它起着
数据压缩（1）——简介永恒星计算机基础数据压缩信息熵
【前言】数据压缩存在于计算机、网络的各个地方，是很底层的技术支持，例如歌曲、图像、视频、网页、文本等的保存和传输都是用过数据压缩算法的。总的来说，我们常使用数据压缩来增多硬盘存储的内容、减少网络传输的流量。数据压缩研究的是，在可接受的信息恢复程度下，可以将信息变得有多紧凑。通常有两个思路：减少数据中不同符号的数据量；用更少的位数对更常见的符号进行编码。数据压缩的算法多种多样，没有万能的算法，通用算
工程项目管理系统源码与Spring Cloud：实现高效系统管理与二次开发微服务技术分享 spring cloud java 工程项目管理系统源码
随着企业规模的不断扩大和业务的快速发展，传统的工程项目管理方式已经无法满足现代企业的需求。为了提高工程管理效率、减轻劳动强度、提高信息处理速度和准确性，企业需要借助先进的数字化技术进行转型。本文将介绍一款采用SpringCloud+SpringBoot+Mybatis技术框架的工程项目管理系统，该系统涵盖了项目管理、合同管理、预警管理、竣工管理、质量管理等多个方面，通过数据字典、编码管理、用户管理
Python世界：简易地址簿增删查改算法实践来知晓 Python世界 python 机器学习开发语言
Python世界：简易地址簿增删查改算法实践任务背景编码思路代码实现本文小结任务背景该任务来自简明Python教程中迈出下一步一章的问题：编写一款你自己的命令行地址簿程序，你可以用它浏览、添加、编辑、删除或搜索你的联系人，例如你的朋友、家人、同事，还有他们诸如邮件地址、电话号码等多种信息。这些详细信息必须被妥善储存以备稍后的检索。编码思路从问题中可以提炼以下信息：1、地址簿需要支持本地存储读写；2
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
详解贪心算法凭君语未可算法软考算法贪心算法
贪心算法什么是贪心算法？贪心算法的特点贪心算法的应用场景贪心算法的基本思路贪心算法的经典应用1.活动选择问题2.最小硬币找零问题3.霍夫曼编码问题贪心算法的正确性贪心算法的优缺点总结什么是贪心算法？贪心算法（GreedyAlgorithm）是一种基于每一步都选择当前最优解的算法设计思想。它在每个阶段总是做出在当前看来最优的选择（局部最优解），而不回溯或考虑整个问题的全局最优性。它期望通过这样逐步构
leetcode--91--解码方法 minningl
题目：一条包含字母A-Z的消息通过以下方式进行了编码：'A'->1'B'->2...'Z'->26给定一个只包含数字的非空字符串，请计算解码方法的总数。示例1:输入:"12"输出:2解释:它可以解码为"AB"（12）或者"L"（12）。示例2:输入:"226"输出:3解释:它可以解码为"BZ"(226),"VF"(226),或者"BBF"(226)。链接：https://leetcode-cn.c
Java-后端程序员个人知识总结金肴羽 java 开发语言
文章目录概要1.编程语言2.数据结构与算法3.数据库知识4.框架和库5.服务器管理6.网络知识7.版本控制8.测试9.安全知识10.系统设计11.编码规范与最佳实践12.持续学习和适应能力概要后端程序员，主要负责应用程序的逻辑、数据库交互、服务器配置以及应用的性能优化等。成为一名优秀的后台程序员，需要掌握以下技能：1.编程语言掌握至少一种后台编程语言JavaPythonHtmlJavaScript
#LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification 向日葵花籽儿 LLM入门教程笔记 prompt 分类数据库
在本章中，我们将重点探讨评估输入任务的重要性，这关乎到整个系统的质量和安全性。在处理不同情况下的多个独立指令集的任务时，首先对查询类型进行分类，并以此为基础确定要使用哪些指令，具有诸多优势。这可以通过定义固定类别和硬编码与处理特定类别任务相关的指令来实现。例如，在构建客户服务助手时，对查询类型进行分类并根据分类确定要使用的指令可能非常关键。具体来说，如果用户要求关闭其账户，那么二级指令可能是添加有
C语言《智能自平衡小车，实现平衡功能的基础上，加入了超声波避障、超声波跟随、蓝牙遥控等功能》+源代码+文档说明 jzpfbpx c语言开发语言
文章目录源代码下载地址项目介绍项目功能项目备注源代码下载地址源代码下载地址点击这里下载源码项目介绍C语言《智能自平衡小车，实现平衡功能的基础上，加入了超声波避障、超声波跟随、蓝牙遥控等功能》+源代码+文档说明项目功能为了实现小车功能，小车硬件主要包括：控制核心板带编码器的直流电机车架12V1900mah锂电池项目备注1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！
物联网之ESP32配网方式、蓝牙、WiFi 智码帮MJ682517 Web前端嵌入式硬件物联网嵌入式硬件物联网 web前端
MENU前言SmartConfig(智能配网)AP模式(AccessPoint模式)蓝牙配网WebServer模式WPS配网(Wi-FiProtectedSetup)Provisioning(配网服务)静态配置(硬编码)总结前言ESP32配网(Wi-Fi配置)的方式有多种，每种方式都有各自的优缺点。根据具体项目需求，可以选择适合的配网方式。SmartConfig(智能配网)原理ESP32通过监听周
文华说天赋～kin1:更新滋养能量活出本源的自己文华_7431
感恩来自玄妙之心的分享今天是2022年5月19日，星期四，农历四月十九，今天的星系印记编码是kin1磁性的红龙，从今天磁性的红龙开始我们进入了红龙波，开启了一次新的卓尔金历的周期，也意味着一个全新的260天的生命能量循环的开始。而红龙波作为卓尔金历的首个波符，即是一个源头之旅，又是一个寻根之旅，那在这个波符我们要如何运用这个能量，开启一个不一样的新周期呢？红龙波的关键词是：滋养更新，是从内到外的滋
linux git log 中文乱码,修复git diff正文中文乱码 weixin_39945871
Linuxgitdiff正文中文乱码在命令行下输入以下命令：$gitconfig--globalcore.quotepathfalse#显示status编码$gitconfig--globalgui.encodingutf-8#图形界面编码$gitconfig--globali18n.commit.encodingutf-8#提交信息编码$gitconfig--globali18n.logoutp
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro