JacKnights

Huffman图像压缩

1、实现基于Huffman编码的图像压缩

实现大体思路遵循上述的原理，关于比特位的处理，如果直接用位运算的话，编写起来较复杂。于是我改用0和1的字符串来逐位表示一个个比特。也就是说，编码过程中经过像素值转成，再由字符串转成比特位，解码过程中经过比特位转成字符串，再由字符串转成像素值。通过字符串作为桥梁，可以避免复杂的位运算，而运行效率也不会下降多少。而至于像素值和字符串怎样转换，还要用到现成的bitset<32>类型。

c++代码如下：

HuffmanEncode.cpp:

HuffmanEncode函数对外使用。调用函数HuffmanEncode，输入图像的二维矩阵，图像的宽高，以及另存的压缩后的文件名，执行后得到压缩后的文件以及头部信息文件。

在HuffmanEncode函数内，findMinNode函数用于找到当前最少出现的节点；buildTree函数用于构建哈夫曼树；每个节点的下标为像素值，存有出现次数，指向左右子节点的下标，以及用来判断是否已删除的位；buildTable函数用于建立像素值和编码值的映射关系。

#include 
#include 
#include 
#include 
#include 

using namespace std;

struct Node {
    int count;
    int left;
    int right;
    int removed;
};

int findMinNode(Node* nodes, int length) {
    int index = -1;
    for (int i = 0; i < length; i++) {
        if ((index == -1 || nodes[i].count < nodes[index].count) && !nodes[i].removed && nodes[i].count > 0) {
            index = i;
        }
    }
    if (index != -1) {
        nodes[index].removed = 1;
    }
    return index;
}

int buildTree(Node* nodes, int* counts) {
    for (int i = 0; i < 256; i++) {
        nodes[i].left = -1;
        nodes[i].right = -1;
        nodes[i].count = counts[i];
        nodes[i].removed = 0;
    }
    int length = 256;

    while (1) {
        int l = findMinNode(nodes, length);
        if (l == -1) {
            break;
        }
        int r = findMinNode(nodes, length);
        if (r == -1) {
            break;
        }
        nodes[length].left = l;
        nodes[length].right = r;
        nodes[length].count = nodes[l].count + nodes[r].count;
        nodes[length].removed = 0;
        length++;
    }
    return length;
}

void buildTable(Node* nodes, int pos, string bits, string * table) {
    int l = nodes[pos].left;
    int r = nodes[pos].right;
    if (nodes[pos].left == -1 && nodes[pos].right == -1) {
        table[pos] = bits;
        return;
    }
    buildTable(nodes, r, bits + "1", table);
    buildTable(nodes, l, bits + "0", table);
}

void HuffmanEncode(unsigned char ** data, int height, int width, const char *writepath) {
    FILE* fp;
    int counts[256];
    memset(counts, 0, sizeof(int) * 256);
    for (int i = 0; i < height; i++) {
        for (int j = 0; j < width; j++) {
            counts[data[i][j]]++;
        }
    }

    Node nodes[256 * 2];
    int length = buildTree(nodes, counts);

    string table[256];
    buildTable(nodes, length - 1, "", table);
    string table_path = "";
    table_path = table_path + writepath + "_table";
    fp = fopen(table_path.c_str(), "w");
    for (int i = 0; i < 256; i++) {
        if (table[i].size() == 0) {
            fprintf(fp, "2\n");
        } else  {
            fprintf(fp, "%s\n", table[i].c_str());
        }
    }
    fclose(fp);

    int total_bit_length = 0;
    for (int i = 0; i < 256; i++) {
        total_bit_length += counts[i] * table[i].size();
    }
    char * str = new char[total_bit_length];
    int cur = 0;
    for (int i = 0; i < height; i++) {
        for (int j = 0; j < width; j++) {
            for (int k = 0; k < table[data[i][j]].size(); k++) {
                str[cur] = table[data[i][j]][k];
                cur++;
            }

        }
    }

    fp = fopen(writepath, "wb");
    int times = total_bit_length / 32 + 1;
    string total = "";
    total = total + str;
    for (int i = 0; i < 32 * times - total_bit_length; i++) {
        total = total + "0";
    }
    fwrite(&total_bit_length, sizeof(int), 1, fp);
    for (int i = 0; i < times; i++) {
        bitset<32> byte(total.substr(32 * i, 32));

        unsigned long tmp = byte.to_ulong();
        fwrite(&tmp, sizeof(int), 1, fp);
    }
    fclose(fp);
}

函数HuffmanDecode直接调用，传入字符类型的数组指针作为解码后数据用于返回到主函数，图像的宽高以及编码文件的路径名。

decodeString函数用于解析由比特位转成的字符串，并将之解析为最终用于返回的解码图像矩阵。其中，传入的map类型参数是读取编码映射表后建立的编码值和像素值的解码映射表，map类型可以极大地减少查表的时间，降低时间复杂度。由于编码值的前缀唯一不会是其它的编码值，所以不会出现错误识别编码字符串的情况。

HuffmanDecode.cpp:

#include 
#include 
#include 
#include 
#include 

using namespace std;

void decodeString(string & total, map<string, int> & table_map, int total_bit_length, unsigned char * data) {
    int index = 0;
    int cur = 1;
    int head = 0;
    while (head < total_bit_length) {
        if (total[head] != '1' && total[head] != '0') {
            head++;
            cur = head + 1;
            continue;
        }
        if (table_map.count(total.substr(head, cur - head))) {
            data[index++] = table_map[total.substr(head, cur - head)];
            head = cur;
            cur = head + 1;
        } else {
            cur++;
        }
    }
}

void HuffmanDecode(unsigned char * decoded_data, int height, int width, const char *readpath) {
    FILE* fp;
    string table[256];
    string path = "";
    path = path + readpath + "_table";
    fp = fopen(path.c_str(), "rb");
    for (int i = 0; i < 256; i++) {
        char tmp[30];
        fscanf(fp, "%s", tmp);
        table[i] = table[i] + tmp;
    }
    fclose(fp);

    map<string, int> table_map;
    for (int i = 0; i < 256; i++) {
        table_map[table[i]] = i;
    }

    fp = fopen(readpath, "rb");
    int total_bit_length;
    fread(&total_bit_length, sizeof(int), 1, fp);
    int times = total_bit_length / 32 + 1;
    string total = "";
    char * str = new char[total_bit_length];
    int *words = new int[times];
    fread(words, sizeof(int), times, fp);
    int cur = 0;
    for (int i = 0; i < times; i++) {
        bitset<32> bits(words[i]);
        string tmp = bits.to_string();
        for (int j = 0; j < 32; j++) {
            str[cur] = tmp[j];
            cur++;
        }
    }
    fclose(fp);

    total = total + str;
    decodeString(total, table_map, total_bit_length, decoded_data);
}

这个文件装的是主函数，以及主函数调用的关于压缩文件文件、头部信息文件和映射表文件等的读写处理的函数。

HuffmanMain.cpp

#include 
#include 
#include 
#include 
#include "HuffmanEncode.cpp"
#include "HuffmanDecode.cpp"

using namespace std;

struct ImageHeader {
    BITMAPFILEHEADER bf;    
    BITMAPINFOHEADER bi;
    int rgb[256];
};

int ReadImage(string path, ImageHeader & ih, unsigned char ** & data) {
    FILE * fp;
    fp = fopen(path.c_str(), "rb");
    if (fp == NULL) {
        return 0;
    } 

    fread(&ih.bf, sizeof(BITMAPFILEHEADER), 1, fp);
    fread(&ih.bi, sizeof(BITMAPINFOHEADER), 1, fp);
    fread(&ih.rgb, sizeof(int), 256, fp);

    if (ih.bi.biBitCount != 8) {
        printf("Gray image only!\n");
        return 0;
    }

    data = new unsigned char*[ih.bi.biHeight];
    int row_width = ih.bi.biWidth + (4 - ih.bi.biWidth % 4);
    for (int i = 0; i < ih.bi.biHeight; i++) {
        data[i] = new unsigned char[ih.bi.biWidth];
    }
    for (int i = ih.bi.biHeight - 1; i >= 0; i--) {
        for (int j = 0; j < ih.bi.biWidth; j++) {
            fread(&data[i][j], 1, 1, fp);
        }
        if (ih.bi.biWidth % 4 > 0) {
            fseek(fp, 4 - ih.bi.biWidth % 4, SEEK_CUR);
        }
    }
    fclose(fp);
    return 1;
}

int CopyHeader(string path, ImageHeader & ih) {
    FILE * fp;
    fp = fopen(path.c_str(), "wb");
    if (fp == NULL) {
        return 0;
    }
    fwrite(&ih.bf, sizeof(BITMAPFILEHEADER), 1, fp);
    fwrite(&ih.bi, sizeof(BITMAPINFOHEADER), 1, fp);
    fwrite(&ih.rgb, sizeof(int), 256, fp);
    fclose(fp);
    return 1;
}

int ReaderHeader(string path, ImageHeader & ih2) {
    FILE * fp;
    fp = fopen(path.c_str(), "rb");
    if (fp == NULL) {
        return 0;
    }
    fread(&ih2.bf, sizeof(BITMAPFILEHEADER), 1, fp);
    fread(&ih2.bi, sizeof(BITMAPINFOHEADER), 1, fp);
    fread(&ih2.rgb, sizeof(int), 256, fp);
    fclose(fp);
    return 1;
}

int WriteImage(string path, ImageHeader & ih2, unsigned char * & decoded_data) {
    FILE * fp;
    fp = fopen(path.c_str(), "wb");
    if (fp == NULL) {
        return 0;
    }
    fwrite(&ih2.bf, sizeof(BITMAPFILEHEADER), 1, fp);
    fwrite(&ih2.bi, sizeof(BITMAPINFOHEADER), 1, fp);
    fwrite(&ih2.rgb, sizeof(int), 256, fp);
    for (int i = ih2.bi.biHeight - 1; i >= 0; i--) {
        fwrite(&decoded_data[i * ih2.bi.biWidth], ih2.bi.biWidth, 1, fp);
        char tmp = 0;
        if (ih2.bi.biWidth % 4 > 0) {
            fwrite(&tmp, 1, 4 - ih2.bi.biWidth % 4, fp);
        }
    }
    fclose(fp);
    return 1;
}

int main() {
    char readpath[50];
    printf("BMP format image name:");
    scanf("%s", readpath);
    ImageHeader ih;
    unsigned char ** data;

    string path = "";
    path = path + readpath + ".bmp";
    if (ReadImage(path, ih, data)) {
        printf("Image %s read successful.\n", readpath);
    } else {
        printf("Image %s reading failed.\n", readpath);
        return 0;
    }

    path = "";
    path = path + readpath + "_head";
    if (CopyHeader(path, ih)) {
        printf("Header file copied.\n");
    } else {
        printf("Header file copying failed.\n");
        return 0;
    }

    path = "";
    path = path + readpath;
    HuffmanEncode(data, ih.bi.biHeight, ih.bi.biWidth, path.c_str());
    printf("Image encoded.\n");

    path = "";
    path = path + readpath + "_head";
    ImageHeader ih2;
    if (ReaderHeader(path, ih2)) {
        printf("Header file read successful.\n");
    } else {
        printf("Header file reading failed.\n");
        return 0;
    }

    path = "";
    path = path + readpath;
    unsigned char * decoded_data = new unsigned char[ih2.bi.biHeight * ih2.bi.biWidth];
    HuffmanDecode(decoded_data, ih2.bi.biHeight, ih2.bi.biWidth, path.c_str());
    printf("Image decoded.\n");

    path = "";
    path = path + readpath + "_decode.bmp";
    if (WriteImage(path, ih2, decoded_data)) {
        printf("Decoded image saved successful.\n");
    } else {
        printf("Decoded image saving failed.\n");
        return 0;
    }
}

2、实验结果

原图像test.bmp：

处理过程：

原图像文件test.bmp与压缩后文件test的大小对比：

压缩率约为15.27%。

解码后的图像test_decode.bmp:

原图像文件test.bmp与解码后图像test_decode.bmp的大小对比：

可以看到，解码后图像能一个字节都不差地被恢复出来。因为是无损压缩，失真率为0。

另再测试原图像test1.bmp：

处理过程：

原图像文件test1.bmp与压缩后文件test1的大小对比：

压缩率约为6.19%。

解码后的图像test1_decode.bmp:

原图像文件test1.bmp与解码后图像test1_decode.bmp的大小对比：

可以看到，解码后图像还是能一个字节都不差地被恢复出来。因为是无损压缩，失真率为0。

3、总结

这次作业，一开始我并没打算纯用C/C++来实现Huffman压缩图像，因为原先不清楚bmp格式的文件怎么读取。但Matlab可以调用函数直接获得图像矩阵，这样不不用去处理文件头部信息了。但是对于Matlab很高级的编程工具，要做到Huffman建树、建表，以及按位来写文件的话却并不知道如何着手，反而是用惯了的C/C++更适合这种工作。于是我开始寻求两种优势兼具的解决方法：先用Matlab读取出图像矩阵，再将图像矩阵通过面向C语言的接口传给C代码压缩处理，最后返回解码后的图像矩阵到Matlab，让Matlab封装图像矩阵成bmp格式文件。这样一来，我既能不去考虑图像文件头部处理，又能用C/C++来从底层实现编码压缩和解码。

通过网上查阅资料，我学到了Matlab的C语言接口mex的基本使用，包括如何在Matlab传递参数，如何在C代码内解析参数。解析的过程有点绕，不过熟练掌握指针的知识的话也能正确处理好参数。

这份代码能正确进行Huffman编码和解码，不过最后我还是改用C++重新实现了一次，因为绕了这么久好像也就差个bmp格式文件的读写罢了，干脆再差点关于bmp的资料，把这个问题也用C语言解决了罢。

以上的代码我花了两天时间来编写，测试起来很痛苦，因为用对着图像矩阵检查像素值是否算对，甚至还要用BinaryViewer来检查二进制位是否正确，如果不正确又会是哪里出错了。每晚都要debug知道三四点，那几天感觉严重缺乏睡眠。

但总体来说，这次大作业，我能应用学到的多媒体技术知识来解决问题并温习了学过的知识，虽然过程不轻松，但最终能正确丝毫无误地解码出图像时，成就感还是满满的，结果还是很让自己满意，并且编程也算是能练练手了。

以下是我一开始用这种方法实现的代码：

Matlab脚本Huffman.m:

img = imread('test.bmp');
%img = rgb2gray(img);
[height, width] = size(img);

mex HuffmanEncode.cpp
HuffmanEncode(int32(img), 'test.txt');

mex HuffmanDecode.cpp
mat = uint8(HuffmanDecode('test.txt', height, width));
imwrite(mat, 'test_decoded.bmp', 'bmp');

HuffmanEncode.cpp:

#include "mex.h"
#include 
#include 
#include 
#include 
#include 

using namespace std;

struct Node {
    int count;
    int left;
    int right;
    int removed;
};

int findMinNode(Node* nodes, int length) {
    int index = -1;
    for (int i = 0; i < length; i++) {
        if ((index == -1 || nodes[i].count < nodes[index].count) && !nodes[i].removed && nodes[i].count > 0) {
            index = i;
        }
    }
    if (index != -1) {
        nodes[index].removed = 1;
    }
    return index;
}

int buildTree(Node* nodes, int* counts) {
    for (int i = 0; i < 256; i++) {
        nodes[i].left = -1;
        nodes[i].right = -1;
        nodes[i].count = counts[i];
        nodes[i].removed = 0;
    }
    int length = 256;

    while (1) {
        int l = findMinNode(nodes, length);
        if (l == -1) {
            break;
        }
        int r = findMinNode(nodes, length);
        if (r == -1) {
            break;
        }
        nodes[length].left = l;
        nodes[length].right = r;
        nodes[length].count = nodes[l].count + nodes[r].count;
        nodes[length].removed = 0;
        length++;
    }
    return length;
}

void buildTable(Node* nodes, int pos, string bits, string * table) {
    int l = nodes[pos].left;
    int r = nodes[pos].right;
    if (nodes[pos].left == -1 && nodes[pos].right == -1) {
        table[pos] = bits;
        return;
    }
    buildTable(nodes, r, bits + "1", table);
    buildTable(nodes, l, bits + "0", table);
}

void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {
    double* dataCursor = mxGetPr(prhs[0]);
    int height = mxGetM(prhs[0]);
    int width = mxGetN(prhs[0]);
    char *writepath = mxArrayToString(prhs[1]);
    FILE* fp;
    int * data = (int *)dataCursor;
    int counts[256];
    memset(counts, 0, sizeof(int) * 256);
    for (int i = 0; i < height; i++) {
        for (int j = 0; j < width; j++) {
            counts[data[i + height * j]]++;
        }
    }

    Node nodes[256 * 2];
    int length = buildTree(nodes, counts);

    string table[256];
    buildTable(nodes, length - 1, "", table);
    string table_path = "table_of_";
    table_path = table_path + writepath;
    fp = fopen(table_path.c_str(), "w");
    for (int i = 0; i < 256; i++) {
        if (table[i].size() == 0) {
            fprintf(fp, "2\n");
        } else  {
            fprintf(fp, "%s\n", table[i].c_str());
        }
    }
    fclose(fp);

    int total_bit_length = 0;
    for (int i = 0; i < 256; i++) {
        total_bit_length += counts[i] * table[i].size();
    }
    char * str = new char[total_bit_length];
    int cur = 0;
    for (int i = 0; i < width; i++) {
        for (int j = 0; j < height; j++) {
            for (int k = 0; k < table[data[height * i + j]].size(); k++) {
                str[cur] = table[data[height * i + j]][k];
                cur++;
            }

        }
    }

    fp = fopen(writepath, "wb");
    int times = total_bit_length / 32 + 1;
    string total = "";
    total = total + str;
    for (int i = 0; i < 32 * times - total_bit_length; i++) {
        total = total + "0";
    }
    fwrite(&total_bit_length, sizeof(int), 1, fp);
    for (int i = 0; i < times; i++) {
        bitset<32> byte(total.substr(32 * i, 32));

        unsigned long tmp = byte.to_ulong();
        fwrite(&tmp, sizeof(int), 1, fp);
    }
    fclose(fp);
}

HuffmanDecode.cpp:

#include "mex.h"
#include 
#include 
#include 
#include 
#include 

using namespace std;

void decodeString(string & total, map<string, int> & table_map, int total_bit_length, double* res) {
    int index = 0;
    int cur = 1;
    int head = 0;
    while (head < total_bit_length) {
        if (total[head] != '1' && total[head] != '0') {
            head++;
            cur = head + 1;
            continue;
        }
        if (table_map.count(total.substr(head, cur - head))) {
            res[index++] = table_map[total.substr(head, cur - head)];
            head = cur;
            cur = head + 1;
        } else {
            cur++;
        }
    }
}

void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {
    const char *readpath = mxArrayToString(prhs[0]);

    int height = mxGetScalar(prhs[1]);
    int width = mxGetScalar(prhs[2]);
    FILE* fp;
    string table[256];
    string table_path = "table_of_";
    table_path = table_path + readpath;
    fp = fopen(table_path.c_str(), "rb");
    for (int i = 0; i < 256; i++) {
        char tmp[30];
        fscanf(fp, "%s", tmp);
        table[i] = table[i] + tmp;
    }
    fclose(fp);

    map<string, int> table_map;
    for (int i = 0; i < 256; i++) {
        table_map[table[i]] = i;
    }

    fp = fopen(readpath, "rb");
    int buffer;
    int total_bit_length;
    fread(&total_bit_length, sizeof(int), 1, fp);

    int times = total_bit_length / 32 + 1;
    string total = "";
    char * str = new char[total_bit_length];
    int *words = new int[times];
    fread(words, sizeof(int), times, fp);
    int cur = 0;
    for (int i = 0; i < times; i++) {
        bitset<32> bits(words[i]);
        string tmp = bits.to_string();
        for (int j = 0; j < 32; j++) {
            str[cur] = tmp[j];
            cur++;
        }
    }
    fclose(fp);
    total = total + str;
    double *res;
    plhs[0] = mxCreateDoubleMatrix(height, width, mxREAL);
    res = mxGetPr(plhs[0]);
    decodeString(total, table_map, total_bit_length, res);
}

数字图像处理（一系列对图像进行处理、分析和改进的技术）编程日记✧ 智能医疗计算机视觉图像处理人工智能
数字图像处理是指对图像进行一系列的数学和算法处理，以增强、分析或理解图像的内容。这些处理包括从基础的像素操作到复杂的高维变换和机器学习模型。1.图像降噪在图像获取和传输过程中，往往会引入噪声。降噪技术用于减少这些噪声，同时尽量保持图像的细节。常见方法有：均值滤波：将像素邻域内的像素值取平均值，从而平滑图像。这种方法简单但可能会模糊边缘。高斯滤波：使用高斯函数为权重对像素进行加权平均，可以更好地平滑
基于语言的三种图像简单去噪算法：高效C++实现 m0_57781768 C语言（C++）算法研究和解读算法 c++计算机视觉
基于语言的三种图像简单去噪算法：高效C++实现图像处理在现代计算机视觉中占有重要地位，而去噪处理则是图像处理的重要环节之一。本文将介绍三种基于语言的简单图像去噪算法，并提供详细的C++实现。我们将重点介绍均值滤波、中值滤波和高斯滤波三种方法，并探讨它们在图像去噪中的应用和效果。引言在数字图像处理中，噪声是不可避免的。它可能是由传感器噪声、传输错误或压缩伪影引起的。去噪的目的是在保留图像重要特征的同
24.7.27学习笔记 kkkkk021106 学习笔记
（按照老师发的学习计划走）先学习数字图像处理：1.单色图像0-255黑到白2.彩色图像：红绿蓝三元组的二维矩阵0-255像元（Pixel，图像元素的简称）是数字图像中最小的单元，代表图像中的一个点。每个像元都有一个特定的颜色和亮度值，组合在一起形成完整的图像。以下是关于像元的一些关键点：定义：像元是构成数字图像的基本单元。每个像元通常由多个颜色通道（如红色、绿色和蓝色）组成每个像元的颜色通常用数字
数字图像处理 - 形态学腐蚀 HelloZEX 数字图像处理 C++图像处理 opencv 形态学处理
一、理论与概念讲解——从现象到本质1.1形态学概述形态学（morphology）一词通常表示生物学的一个分支，该分支主要研究动植物的形态和结构。而我们图像处理中指的形态学，往往表示的是数学形态学。下面一起来了解数学形态学的概念。数学形态学（Mathematicalmorphology）是一门建立在格论和拓扑学基础之上的图像分析学科，是数学形态学图像处理的基本理论。其基本的运算包括：二值腐蚀和膨胀、
matlab计算正交变换,图像的正交变换matlab.pdf 大Victor matlab计算正交变换
图像的正交变换matlab《数字图像处理》课程实验报告实验名：图像的正交变换实验1院系：自动化测试与控制系班级：1201132姓名：李丹阳学号：1120110113哈尔滨工业大学电气工程及自动化学院光电信息工程2015年12月13日一、实验原理二、实验内容三、实验结果与分析1、傅立叶变换A)绘制一个二值图像矩阵,并将其傅立叶函数可视化。(傅里叶变换A)的实验结果B)利用傅立叶变换分析两幅图像的相关
MATLAB--数字图像处理图像几何变换海轰Pro
一、实验名称图像的几何变换二、实验目的1.熟悉MATLAB软件的使用。2.掌握图像几何变换的原理及数学运算。3.于MATLAB环境下编程实现对图片不同的几何变换。三、实验内容1.将图像绕图像中心顺时针旋转30度，旋转之后的图像尺寸保持为原图像的尺寸。2.将原图像放大2倍3.得到该图像的水平镜像图片4.得到该图像的垂直错切图像四、实验仪器与设备Win1064位电脑MATLAB2017a五、实验原理图
《数字图像处理-OpenCV/Python》连载：形态学图像处理 youcans_ opencv python 图像处理计算机视觉人工智能
《数字图像处理-OpenCV/Python》连载：形态学图像处理本书京东优惠购书链接https://item.jd.com/14098452.html本书CSDN独家连载专栏https://blog.csdn.net/youcans/category_12418787.html第12章形态学图像处理形态学图像处理是基于形状的图像处理，基本思想是利用各种形状的结构元进行形态学运算，从图像中提取表达和
数字图像处理2——图像基本运算苏俗数字图像处理实战 opencv 人工智能计算机视觉
1.改写彩色图像像素的RGB值#RGB真彩色图像的数据结构#导入用到的包importnumpyasnpimportcv2ascvimportmatplotlib.pyplotasplt%matplotlibinline#读入一幅彩色图像img=cv.imread('./imagedata/old_villa.jpg',cv.IMREAD_COLOR)img2=img.copy()print('数组
如何用 Canvas 实现 PS 的液化功能
最近在做业务需求时，需要实现对图片的液化功能，类似于美图秀秀的瘦脸功能。这已经不仅是图片缩放、拖动、剪裁这类对图片整体的操作了，而是需要对图片的像素进行一系列的计算和修改，那么该怎么实现这个功能呢？基础知识在进入正题之前，我们先来了解一些数字图像处理和Canvas的基础知识。图像处理里的像素是什么现实世界中，人眼直接看到的图像或者在相机中拍摄到的影像，这类图片的最大特点是图像相关的物理量变化是连续
视频剪辑,人脸贴纸美颜特效数字图像处理背后的技术-Qt版本 chenchao_shenzhen Qt 音视频开发计算机视觉 qt5 音视频数字图像处理视频剪辑人脸特效
Qt能做什么？其实大部分都是一些c++最擅长的领域，客户端软件，工具软件。Qt最擅长什么？这个看主流的行业巨头，比如Autodesk的3D建模动画软件maya,Adobe的3D贴图绘制软件SubstancePainter，音视频剪辑软件三巨头之一达芬奇。这三家都是行业垄断巨头之一，所以2010年之后，我们说Qt开发过什么软件，就不能只说vlc,googleEarth了。甚至你跑到开源社区去看，80
矩阵与计算机论文,数字图像处理中矩阵变换的应用探索-数字图像处理论文-计算机论文.docx... weixin_39977642 矩阵与计算机论文
数字图像处理中矩阵变换的应用探索-数字图像处理论文-计算机论文——文章均为WORD文档，下载后可直接编辑使用亦可打印——摘要：从矩阵变换入手,将矩阵变换应用到图像处理中,且通过直方图匹配法及欧几里得距离法求取相似度来进行人脸识别和预测。所得实验结果直观高效,相似度均能达到90%以上。关键词：数字图像处理;矩阵变换;人脸识别和预测;相似度;Abstract：Thispaperstartswithma
矩阵在计算机图像处理中的应用,英语翻译在实际应用中,矩阵不仅对于我们求解线性方程组提供了很好的方法,还在计算机等领域得到了广泛的应用：数字图像处理,人... 光露矩阵在计算机图像处理中的应用
共回答了21个问题采纳率：100%Inpracticalapplication,thematrisisnotonlyprovideagoodmethodforustosolvelinearsimultaneousequations,butalsoputintowidelyuseincomputerfield:digitalimageprosessing,ArtificialIntelligence
Python中使用opencv-python进行人脸检测雪域迷影 OpenCV Python编程编程语言学习 opencv python 人工智能
Python中使用opencv-python进行人脸检测之前写过一篇VC++中使用OpenCV进行人脸检测的博客。以数字图像处理中经常使用的lena图像为例，如下图所示：使用OpenCV进行人脸检测十分简单，OpenCV官网给了一个Python人脸检测的示例程序，objectDetection.py代码如下：from__future__importprint_functionimportcv2as
OpenCV入门：图像处理的基石白猫a~ 编程 opencv
在数字图像处理领域，OpenCV（开源计算机视觉库）是一个不可或缺的工具。它包含了一系列强大的算法和函数，使得开发者可以轻松地处理图像和视频数据。本文将带你走进OpenCV的世界，了解其基本概念和常见应用。1.OpenCV简介OpenCV，全称OpenSourceComputerVisionLibrary，是一个开源的计算机视觉和机器学习库。它支持多种编程语言，包括C++、Python、Java等
如何用 Canvas 实现 PS 的液化功能
最近在做业务需求时，需要实现对图片的液化功能，类似于美图秀秀的瘦脸功能。这已经不仅是图片缩放、拖动、剪裁这类对图片整体的操作了，而是需要对图片的像素进行一系列的计算和修改，那么该怎么实现这个功能呢？基础知识在进入正题之前，我们先来了解一些数字图像处理和Canvas的基础知识。图像处理里的像素是什么现实世界中，人眼直接看到的图像或者在相机中拍摄到的影像，这类图片的最大特点是图像相关的物理量变化是连续
【全网最低价】司守奎《数学建模算法与应用》第三版pdf+数学建模资料（非常详细的算法学习和路线）小白推荐阿贵学长数学建模学习算法 matlab 性能优化深度学习
1.《数学建模算法与应用》主要内容包括时间序列、支持向量机、偏最小二乘面归分析、现代优化算法、数字图像处理、综合评价与决策方法、预测方法以及数学建模经典算法等内容。文章末尾有电子版PDF文件链接2.算法学习流程及详细过程主要算法：工具箱推荐遗传算法-beatxbx工具箱，求解速度很快，并行计算LIBSVM-比MATLAB自带工具箱好用得多yamlip，特别推荐，统一优化求解工具箱由于文件很多，学长
数字图像处理与Python语言实现-常见图像特效（一）视觉&物联智能数字图像处理与Python实现 python 开发语言数字图像处理图像处理人工智能机器视觉计算机视觉
文章目录0、准备1、亮度调节2、细节强化3、底片效果4、卡通效果5、浮雕效果6、铅笔素描效果7、夏季或温色滤镜8、冬季或冷色滤波在本文中将演示使用OpenCV来模仿流行的Photoshop或Instagram滤镜的各种图像处理技术。在文章中，我们将尝试使用各种滤镜，其中许多滤镜会生成原始图像的艺术效果图。正如您将在文章中看到的，其中许多效果需要进行一些实验，并且给定滤镜的结果可能会根据所使用的特定
数字图像处理与Python语言实现-常见图像特效（三）视觉&物联智能数字图像处理与Python实现 python 计算机视觉 opencv 人工智能图像处理机器视觉图像特效
文章目录18、提高曝光度19、轮廓滤镜/图像锐化20、风格化滤镜21、颜色化滤镜22、扩散/毛玻璃效果23、碧绿效果24、漫画效果25、边缘发光/增强效果26、冰冻效果本文为前面文章：数字图像处理与Python语言实现-常见图像特效（二）数字图像处理与Python语言实现-常见图像特效（一）的延续。18、提高曝光度def
CT重建平行射线滤波反投影 73826669 图像处理傅立叶分析图像处理
计算机断层重建(CT)是一个比较热门的领域，这篇文章简单介绍了反投影方法的重建过程。参考资料：冈萨雷斯，《数字图像处理》，电子工业出版社。文章目录直接反投影投影与Radon变换滤波反投影法(FBP)傅里叶切片定理平行射线下的滤波反投影重建卷积与傅里叶反变换直接反投影该方法是沿着射线来的方向把一维信号反投影回去，可以想象成把投影穿过图像区域反“涂抹”回去。注意到相隔180°的投影互为镜像，因此，为了
数字图像处理实验记录七（彩色图像处理实验）泉绮数字图像处理实验记录计算机视觉图像处理 opencv
一、基础知识经过前面的实验可以得知，彩色图像中的RGB图像就是一个三维矩阵，有3个维度，它们分别存储着R元素，G元素，B元素的灰度信息，最后将它们合起来，便是彩色图像。这一次实验涉及CMYK和HSI颜色模型，不妨搜索一下：CMYK：CMYK颜色模型包括青(cyan)、品红(magenta)、黄(yellow)和黑(black)，为避免与Blue混淆，黑色用K表示。彩色打印、印刷等应用领域采用打印墨
形态学操作之开操作与闭操作的python实现——数字图像处理筱筱西雨图像处理 python 计算机视觉人工智能图像处理算法
原理图像处理中的开操作（Opening）和闭操作（Closing）是形态学（Morphological）操作的两个基本类型，它们都是基于膨胀（Dilation）和腐蚀（Erosion）操作。这些操作通常用于二值化图像，但也可以应用于灰度图像。腐蚀（Erosion）腐蚀操作的目的是缩小或消除图像中的前景（通常是白色）对象。在腐蚀操作中，使用一个结构元素（或核）在图像上滑动。如果结构元素在某个位置下的
数字图像处理实验记录十（图像分割实验）泉绮数字图像处理实验记录计算机视觉图像处理 opencv
一、基础知识1、什么是图像分割图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程，特性可以是灰度、颜色、纹理等，目标可以对应单个区域，也可以对应多个区域。2、图像分割是怎么实现的图像分割算法基于像素值的不连续性和相似性，不连续性是图像的边缘，再根据制定的准则将图像分割为相似的区域，如阈值处理、区域生长、区域分离和聚合。二、实验要求三、实验记录(具体任务只展示对图片1的处理）总代码
数字图像处理实验记录八（图像压缩实验）泉绮数字图像处理实验记录图像处理 matlab
前言：做这个实验的时候很忙，就都是你抄我我抄你了一、基础知识1．为什么要进行图像压缩：图像的数据量巨大，对计算机的处理速度、存储容量要求高。传输信道带宽、通信链路容量一定，需要减少传输数据量，提高通信速度。因此要进行图像压缩，减少数据量。2．怎么进行图像压缩：我们使用霍夫曼编码进行压缩。霍夫曼编码原理是利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码，对于出现概率
数字图像处理实验记录九（数字形态学实验）泉绮数字图像处理实验记录计算机视觉图像处理 matlab
一、基础知识1.形态学，用于从图像中提取对表达和描绘区域形状有意义的图像分量，使后续的识别工作能够抓住目标对象最为有本质的形状特征，如边界连通区域等。2.膨胀运算：膨胀会使目标区域范围“变大”，将于目标区域接触的背景点合并到该目标物中，使目标边界向外部扩张。作用就是可以用来填补目标区域中某些空洞以及消除包含在目标区域中的小颗粒噪声。3.腐蚀运算：腐蚀可以使目标区域范围“变小”，其实质造成图像的边界
关于数字图像处理考试泉绮数字图像处理实验记录计算机视觉 opencv 图像处理
我们学校这门科目是半学期就完结哦，同学们学习的时候要注意时间哦。选择题不用管，到时候会有各种版本的复习资料的。以下这些东西可能会是大题的重点：我根据平时代码总结的，供参考基本操作：1.读图：imread(‘图片路径’)2.显示图：imshow(图片)3.开新窗口：figure()4.rgb转灰度图：rgb2gray(图片)5.灰度图合成彩色图：图片=cat(3,灰度图1，灰度图2，灰度图3);实验
re:从0开始的CSS学习之路 5. 颜色单位扶摇| 从0开始的CSS之旅 css 学习前端
0.写在前面没想到在CSS里也要再次了解这些颜色单位，感觉回到了大二的数字图像处理，可惜现在已经大四了，感觉并没有学会什么AI的东西1.颜色单位预定义颜色名：HTML和CSS规定了147种颜色名。例如：redyellowgreenblueRGB颜色值rgb(red,green,blue)：括号中每个参数代表对应颜色的浓度浓度值是0-255之间的整数，0表示无浓度，255表示最大浓度也可以使用百分比
数字图像处理与Python语言实现-常见图像特效（二）视觉&物联智能数字图像处理与Python实现 python opencv 计算机视觉人工智能图像处理机器视觉图像特效
文章目录9、Splash滤镜10、双色调（Duo-Tone）滤镜11、日光（Daylight）滤镜12、60sTVs效果13、高对比度14、棕褐色/复古滤镜15、晕影效果16、模糊滤镜17、浮雕边缘9、Splash滤镜在Splash滤镜中，仅某些颜色保持原样，其余颜色转换为灰度。为了执行此操作，我们将在HSV颜色空间中使用cv2.inRange。这可用于形成具有该范围内的值的所有像素的掩码，并且这
数字图像处理（实践篇）四十三 OpenCV-Python 使用SURF算法检测图像上的特征点的实践 Jackilina_Stone 数字图像处理（入门篇实践篇综合篇）python 数字图像处理计算机视觉 OpenCV
目录一SURF算法概述1积分图2SURF算法3SIFT与SURF二涉及的函数三实践一SURF算法概述
【数字图像处理】2021期末复习考试重点大纲 Rose J 复习数组图像处理复习
本文目录数字图像处理期末复习1.填空（每空2分，共20分）1.均值滤波计算2.中值滤波计算3.水平方向一阶锐化计算4.无方向一阶锐化计算5.位图文件存储所需要的数据量计算2.问答（每题10分，共10分）1、什么是采样，简述采样间隔与图像的关系。2、什么是量化，简述量化等级与图像关系。3、简述中值滤波器对不同类型的噪声抑制效果。4、对于一张灰度图像，其梯度是如何定义的？图像梯度的物理意义是什么？3.
数字图像处理之二维码图像提取算法（十） Snail_Walker Video Coding &Image Pro opencv2 threshold 二值化
这里来说明一下做这次的二维码提取算法用到的函数，最后再给出完整的代码！进行图像的二值化，这里可以使用opencv2里的函数threshold，当然在opencv里也有cvThreshold函数（这个函数可以具体参考：http://blog.csdn.net/xuehuic/article/details/7401181）首先我们要了解：最简单的图像分割的方法。应用举例：从一副图像中利用阈值分割出我
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

Huffman图像压缩

Huffman图像压缩

1、实现基于Huffman编码的图像压缩

c++代码如下：

HuffmanEncode.cpp:

HuffmanDecode.cpp:

HuffmanMain.cpp

2、实验结果

3、总结

你可能感兴趣的:(数字图像处理)