【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)

源于大作业~~

目录

前言

一、实现算法

二、结果展示

三、算法框架 

(1) QuadTreeNode.h

(2) 结点扩展、细化模糊层次 

(3) 模糊化图像四叉树转为图像

(4) 主函数代码

四、说明

五、结语 


前言

一张图片常常会存在空间冗余,即一大部分区域的色彩值相同,然而存储时却将这些像素块视作不同的色彩值,以满足较好的格式规整化。除了存储图片外,对于图片精度不是很高的要求、或者说要求对图片进行一定的模糊化处理,这种种情况都要求对图片的空间冗余进行降低。

针对模糊处理图片的要求,对图片分成四个象限,用一颗四叉树记录,四叉树的叶子结点记录图片的像素值,中间结点用于评判/细分模糊层次。

这样就可以根据一张图片的冗余/细节的分布,自动地进行选择模糊层次。

关键词:四叉树,自适应模糊,图片处理,空间冗余


一、实现算法

模糊化/降低冗余等等,可以将一块区域的色彩值用一个RGB块代替,而不至于每个色彩都单独备份一个。而这个过程,可以将一块区域的像素值,通过计算、选择出一个代表的像素值,来代替这个区域的所有像素值。针对模糊图片问题,为了保持一定的平滑性,采取中位数/均值等简单方法可以做到,也可以进阶采用高斯模糊等等手段。我采用了简单的均值模糊。

然而,一张图片,总是有部分存在空间冗余,部分边缘细节较多,统一的进行模糊,是不理智且不满足要求的。对此,评判一张图片是否需要模糊化,我们可以通过判断其“离散”情况来选择。最简单的“离散”情况度量,即计算RGB三色的方差。当方差和阈值Tolerance进行比较,小于阈值意味着这一个区域的相似程度足够高可以进行均值模糊;大于阈值则意味着相似程度不够高,需要继续细分细化,再进行上述操作。

对此,可以得出以下递归算法:

①图像计算RGB三色方差D1,D2,D3。

②D1>Tolerance || D2>Tolerance || D3>Tolerance 跳转到③否则跳转到④

③标记子图为中间结点。将子图分为四个区域,对每个子图,跳转到①

④计算子图RGB的均值ER,EG,EB,将这一区域所有的像素RGB值赋为对应均值ER,EG,EB。标记为叶子结点。返回。

    一开始,用一个四叉树结点root记录整张图片的像素信息,采用上述递归算法,可以将这一个root结点扩展到一棵树,这棵树的所有的叶子结点记录着整个模糊化后的图的信息。

    将整棵树转化为图时,只需要遍历整棵树,将叶子结点的色彩区块信息取出并整合,就可以得到模糊化后的图片。

不是很明白算法?看下面这张图片你就明白了!

对图片划分越细,细节越多;反之越粗糙。对于那些分块后满足阈值要求的图像,就模糊并存储其像素值,否则继续细分——直到满足阈值或图片足够小。

二、结果展示 

原图:

Tolerance:0                               

      Tolerance:5

Tolerance:15

Tolerance:25

【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)_第1张图片

Tolerance:35

【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)_第2张图片

Tolerance:50

【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)_第3张图片

Tolerance:100(haha~~)

【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)_第4张图片


三、算法框架 

因为大作业提交时间还没有截止,所以不方便开源所有代码,这里给出框架。

(1) QuadTreeNode.h

struct Pos	//偏移量记录
{
    int x, y;
};
struct color	//像素RGB值记录
{
    unsigned char r;
    unsigned char g;
    unsigned char b;
};
class QuadTreeNode
{
public:
//记录细分的四个子图(valid==false,需要细化的情况下链接子图)
QuadTreeNode *q1, *q2, *q3, *q4; // 1~4象限
//记录子图相对于原图的偏移量,以便树转图
Pos position;
//记录子图的长宽像素数
int height, width;
//记录是否为叶子结点,即是否为模糊化图像信息记录结点
bool valid;
//这一结点对应的范围的色彩信息
color **rgbs;
//记录结点深度
    int depth;
public:
    QuadTreeNode(color **r, int wd, int ht);
    QuadTreeNode(int posx, int posy, int wd, int ht);
//计算是否差异超过Tolerance
bool VarianceCalculate(int Tolerance);
//随机化模糊
bool RandomPuzzyTag();
//计算R均值
int AverageR();
//计算G均值
int AverageG();
//计算B均值
int AverageB();
//模糊化区域
    void Fuzzify();
};

(2) 结点扩展、细化模糊层次 

//以Tolerance为模糊阈值,扩展rt结点(自然少不了递归)
void TreeFuzzifyExtend(QuadTreeNode *rt, int Tolerance){...}

(3) 模糊化图像四叉树转为图像

//将四叉树记录的模糊化后的图像像素信息传递给二维数组img[][]
void TreeToImage(QuadTreeNode *rt, color **img){...}

(4) 主函数代码

值得说明的是,实验所给的图片为ppm格式,因此读写比较特殊。

#include 
#include 
#include 
#include 
#include "QuadTreeNode.h"
// #include "QuadTree.h"
#include "QuadTreeFunc.h"

void printImage(char *fileName, int width, color **a);
// color color;

// To get ppm image from jpeg file, please visit https://convertio.co/jpg-ppm/
void readImage(int p, char *inFile, char *outFile) // Note that width == height here
{
	FILE *f = fopen(inFile, "rb");

	char u[3]; // placehoder
	int width, height, max_value;
	fscanf(f, "%s%d%d%d%c", u, &width, &height, &max_value, &u[0]);

	int i;
	color **colors, **img;
	colors = (color **)malloc(height * sizeof(color *));
	img = (color **)malloc(height * sizeof(color *));
	for (i = 0; i < height; i++)
	{
		colors[i] = (color *)malloc(width * sizeof(color));
		img[i] = (color *)malloc(width * sizeof(color));
	}
	for (i = 0; i < height; i++)
		fread(colors[i], sizeof(color), width, f);
	fclose(f);
	//=============================================================
	QuadTreeNode *rt = new QuadTreeNode(colors, width, height);
	TreeFuzzifyExtend(rt,100);
	TreeToImage(rt, img);
	//=============================================================
	printImage(outFile, width, img);
}

void printImage(char *fileName, int width, color **a) // Note that width == height here
{
	FILE *f = fopen(fileName, "wb");

	fprintf(f, "P6\n");
	fprintf(f, "%d %d\n", width, width);
	fprintf(f, "255\n");

	int i;
	for (i = 0; i < width; i++)
		fwrite(a[i], sizeof(color), width, f);

	fclose(f);
}

// int main(int argc, char **argv)
int main()
{
	int tolerance = 0;
	char inFile[100];
	char outFile[100];
	// if (argc > 1)
	{
		// tolerance = atoi(argv[1]);
		// inFile = argv[2];
		// outFile = argv[3];
		strcpy(inFile,"D:\\...\\a.ppm");
		strcpy(outFile,"D:\\...\\result.ppm");
		readImage(tolerance, inFile, outFile);
	}
	return 0;
}

 除了正常的I/O和预处理,自己编写的部分,千言万语汇成主函数的几行话:

【数据结构与算法】图像——四叉树自适应模糊(ppm图像为例)_第5张图片


四、说明

1、可以采用命令行读取指令的方式,但是为了方便调试,我修改了那部分源代码。可以通过重载的main函数 int main(int argc, char **argv) 来实现。

2、除了均值模糊外,还可以选择中位数模糊

3、随机模糊化处理的部分,被我注释掉了

4、将ppm格式转为jpg格式可以简单的采用python库函数

from PIL import Image
 
img = Image.open("D:\\...\\a.ppm")
img.save("D:\\...\\a.jpg")

#img.show()

5、为了得到更加平滑的处理结果,可以了解一下高斯模糊这种高级的玩意

6、其余源代码将在大作业提交结束后上传开源。 


五、结语

无论数据结构与算法还是程序设计等等 ,不要局限于作业,做一些小东西,小项目,小工程,小工具等等,都会让学习变得有趣。谁不想有一个能吹牛逼的本科呢?

你可能感兴趣的:(数据结构与算法,四叉树,图像处理,图像模糊,四叉树自适应图像模糊,数据结构与算法)