DPCM 压缩系统的实现和分析
掌握DPCM编解码系统的基本原理。初步掌握实验用C/C++/Python等语言编程实现DPCM
编码器,并分析其压缩效率。
S(n)是输入信号,Sr(n)是重建信号,作为预测器确定下一个信号估计值的输入信号。Sp(n)是预测语音信号,d(n)是预测误差信号,d(n)=S(n)-Sp(n),d(n)也称为差值信号或余量信号。DPCM系统实际上就是对这个差值信号进行量化编码,用来补偿过去编码中产生的量化误差,它是一个反馈系统,采用这种结构可以避免量化误差的积累。dq(n)是量化后的差值信号。最后将量化后的差值信号送入编码器编码。
经查阅资料得知:
本次实验使用以下两幅yuv图像进行实验测试:
具体步骤:
①首先读取一个256级的灰度图像,采用设定的预测方法计算预测误差,并对预测误差进行8比特、1比特、2比特和4比特的量化设计。
②在DPCM编码器实现的过程中同时输出预测误差图像和重建图像。
③将预测误差图像写入文件并将该文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。
④将原始图像文件输入Huffman编码器,得到输出码流、给出概率分布图并计算压缩比。
⑤最后比较两种系统(1.DPCM+熵编码和2.仅进行熵编码)之间的编码效率(压缩比和图像质量),压缩质量以PSNR进行计算。
首先开辟三个空间分别存储原始图像,预测误差图像及重建图像:
char* FileName = NULL;//原文件
char* Reconstruction_FileName = NULL;//重建电平文件
char* ERROR_FileName = NULL;//预测误差文件
FILE* File = NULL;
FILE* ERROR_File = NULL;
FILE* Reconstruction_File = NULL;
FILE* y_pr = fopen("江疏影2_y_pr.txt", "w");
FILE* error_y_pr = fopen("江疏影2_error_y_pr(1bits).txt", "w");
FileName = argv[4];
Reconstruction_FileName = argv[5];
ERROR_FileName = argv[6];
unsigned char* ybuffer = (unsigned char*)malloc(sizeof(char) * (frameWidth * frameHeight));
unsigned char* ybuffer1 = ybuffer;
unsigned char* uvbuffer = (unsigned char*)malloc(sizeof(char) * (frameWidth * frameHeight*0.5));
unsigned char* new_ybuffer = (unsigned char*)malloc(sizeof(char) * (frameWidth * frameHeight));
unsigned char* error_quantify = (unsigned char*)malloc(sizeof(unsigned char) * (frameWidth * frameHeight));
File = fopen(FileName, "rb");
fread(ybuffer1, 1, frameWidth * frameHeight, File);
fread(uvbuffer, 1, frameWidth * frameHeight * 0.5, File);
用单独函数实现DPCM,同时reconstruction_value、error_File作为重建图像、预测误差图像输出
void DPCM(int width,int height,unsigned char *input, int bit,unsigned char* reconstruction_value, unsigned char* error_File)
在DPCM函数中,量化+预测+反量化为(注:此处仅以左上角第一个像素举例):
double Q_Level = pow(2, bit);//量化级数
double Q_interval = 512 / Q_Level;//量化间隔
char* error1=error_value;//误差
int error2 = 0;
unsigned char* error3 =error_File;
/*对第一个像素进行预测*/
*error1 = (char)(*buffer - 128);//左侧预测时假设第一个像素的左侧像素灰度值为128
error2 =(int) ((*error1+255) / Q_interval);//量化值
*error3 = (unsigned char)error2;
*value = (unsigned char)((*error3 - 255 / Q_interval) * Q_interval + 128);//反量化
if (*value > 255) *value = 255;
if (*value < 0) *value = 0;
value++;
error1++;
buffer++;
error3++;
PSNR同样单独实现:
double PSNR(unsigned char* Original_File, unsigned char* Noisy_File, int m, int n)
关键部分:
for (int j = 0; j < n; j++)
{
for (int i = 0; i <m; i++)
{
sub = *Original_File - *Noisy_File;
sum = sum + pow(sub, 2);
Original_File++;
Noisy_File++;
}
}
MSE = (sum) / (m * n);
double psnr = 10 * log10((255 * 255) / MSE);
写数据流:
fwrite(new_ybuffer, 1, frameWidth * frameHeight, Reconstruction_File);
fwrite(uvbuffer, 1, frameWidth * frameHeight*0.5, Reconstruction_File);
fwrite(error_quantify, 1, frameWidth * frameHeight, ERROR_File);
fwrite(uvbuffer, 1, frameWidth * frameHeight*0.5, ERROR_File);
cout<<"PSNR="<<PSNR(ybuffer, new_ybuffer, frameWidth, frameHeight)<<endl;
计算概率分布,本处的想法是将概率用TXT文本输出,再用MATLAB绘图:
double value_buffer2[256] = {
0 }; double ybuffer_PR2[256] = {
0 };
for (int j = 0; j < frameHeight; j++)
{
for (int i = 0; i < frameWidth; i++)
{
value_buffer2[*error_quantify1]++;
error_quantify1++;
}
}
for (int i = 0; i < 256; i++)
{
ybuffer_PR2[i] = (value_buffer2[i]) / (frameWidth * frameHeight);
}
for (int i = 0; i < 256; i++)
{
fprintf(error_y_pr, "%f\n", ybuffer_PR2[i]);
}
利用cmd命令将预测误差图像送入哈夫曼编码器:
得到输出码流:
图像 | “江疏影1.yuv” | “江疏影2.yuv” |
---|---|---|
仅进行熵编码压缩比 | 14.173% | 5.556% |
8比特量化+熵编码压缩比 | 37.008% | 22.222% |
4比特量化+熵编码压缩比 | 55.906% | 43.334% |
2比特量化+熵编码压缩比 | 61.417% | 55.556% |
1比特量化+熵编码压缩比 | 55.512% | 52.593% |
图像 | “江疏影1.yuv” | “江疏影2.yuv” |
---|---|---|
8比特量化 | 51.6708 | 51.3833 |
4比特量化 | 9.62959 | 12.0931 |
2比特量化 | 8.07821 | 7.73468 |
1比特量化 | 9.9115 | 8.62089 |
①预测误差图像的Y概率分布更加集中,分布更加均匀,熵大,像素间关联性越大,更容易压缩。
②对于同一幅图,DPCM+熵编码后的压缩比明显更大,且量化比特数越大,压缩比越大,但是结合PSNR来看,由于PSNR值越大,图像质量越好,而量化比特数越大,PSNR呈下降趋势,故实际中并不是为了压缩就选择更小的量化比特数。
①通过此次实验,我发觉和最初的实验相比,自己对使用C语言处理图像更加熟练,流畅,在此十分感谢帮助过我的同学、老师!
②在量化时涉及int和unsigned char类型的变换使用,如果处理不当会出现这种错误: