Matlab 简单图像处理

一、图像处理的基本操作

1.从图形文件读取图像

pic = imread('C:\Users\Good\Pictures\m.jpg');

通过 matlab 自带的 imread 读入图像,函数内为图像的路径。如果图片在当前文件夹下,可以通过图片名直接导入。pic = imread('m.jpg');

2.显示图像

imshow(pic);

通过上面的简单操作,我们已经可以在 matlab 中读入图像文件,并显示出来。接下来我们要对图像本身的一些问题进行原理性的讲述。

二、关于图像

1.光的三基色

(1) 学过高中物理的我们都听说过 “光的三基色”,光的三基色,就是光的三种基础颜色(R 红色、G 绿色、B 蓝色),不可以通过其他颜色混合得到。但我们却可以通过将这三种颜色混合获得自然界中绝大部分颜色。

(2) 在 matlab 中,颜色的表示就是通过显示 RGB 相应的数值来表示颜色。通常情况下,RGB 各有 256 级亮度,用数字表示为从 0、1、2… 直到 255,共 256 级。每个基色分量直接决定显示设备的基色强度。

imfinfo('C:\Users\Good\Pictures\m.jpg') %获取图像文件的信息
size(pic)
图像文件信息

可以看出图像在 matlab 中就是一个 Height ✖ Width ✖ 3 的一个 uint8 类型的矩阵,其中 Height、Width 是图像的大小,也就是像素点。一个个像素点上其中 3 即为 RGB 的三个数值,用来表示该像素点的颜色,通过像素点的坐标来定位到像素点。

R = pic(:,:,1);
G = pic(:,:,2);
B = pic(:,:,3);
图像中的像素点

2.灰度图像

灰度是描述灰度图像内容的最直接的视觉特征。它指黑白图像中点的颜色深度,范围一般从 0 到 255,白色为 255,黑色为 0,故黑白图像也称灰度图像。灰度图像矩阵元素的取值通常为 [0,255],因此其数据类型一般为 8 位无符号整数,这就是人们通常所说的 256 级灰度。

灰度图像

3.彩色图像转化成灰度图像

rgb2gray是 matlab 的内置函数,用来将 RGB 图像或颜色图转换为灰度图。灰度图的图像矩阵是一个 Height ✖ Width ✖ 1 的一个 uint8 类型的矩阵。也就是将三基色RGB的数值转化为一维的灰度值,便于图像处理。彩色图像转换为灰度图像时,需要计算图像中每个像素有效的亮度值,其计算公式为:Y = 0.3R + 0.59G + 0.11B

图像矩阵
turn_pic = rgb2gray(pic);
pic = double(pic);  %需要转化类型,不然计算结果可能不同
turn_pic(1,1)
0.3*pic(1,1,1) + 0.59*pic(1,1,2) + 0.11*pic(1,1,3)

4.灰度图像转化为彩色图像

将灰度图像转换为彩色图像,称为灰度图像的伪彩色处理。

伪彩色处理技术的实现方式有很多,如:灰度分割法、灰度级-彩色变换法、滤波法等等。以下采用的是灰度级-彩色变换法,这是将来自传感器的灰度图像送入三个不同特征的 R、G、B 变换器,然后将三种变换器的不同输出分别送到彩色显示器进行显示的技术。

gray2rgb函数可以将灰度图转化为彩色图,不过需要下载相关文件,需要的话可以自行搜索,而且执行效率很低。

映射关系如下,其中 R(x,y)、G(x,y)、B(x,y) 分别表示 R、G、B 的颜色值,f(x,y) 表示特定点灰度图像的灰度值,f 是所选灰度图像的灰度值。

5. 二进制图像

二进制图像也称为二值图像,通常用一个二维数组来描述,1 位表示一个像素,组成图像的像素值非 0 即 1,没有中间值,通常 0 表示黑色,1 表示白色。二进制图像一般用来描述文字或者图形,其优点是占用空间少,缺点是当表示人物或风景图像时只能描述轮廓。一般我们可以通过设置阈值来进行二进制图像转化,matlab 中可以利用im2bw从灰度、索引、RGB 图象创建二值图。

6.索引图像

索引图像是一种把像素值直接作为 RGB 调色板下标的图像。在 Matlab 中,索引图像包含一个数据矩阵 X 和一个颜色映射(调色板)矩阵 map。数据矩阵可以是 8 位无符号整型、16 位无符号整型或双精度类型的。可以通过以下代码对索引图像和 RGB 图像进行转化:

IND = rgb2ind(pic,n);  % pic为RGB图像矩阵,map为颜色映射矩阵,最多包含n个颜色。n必须小于或等于 65,536。
RGB = ind2rgb(pic,map);  % pic为索引图像矩阵,map为颜色映射矩阵

7.小结

图像类别 英文名称 英文缩写
RGB rgb rgb
灰度 gray gray
索引 index ind
二进制 binary bin

2 英文 two 和 to 发音相同,所以很多转换类函数都用 2 来命名而非 to。比如number to string, 不是命名为numTostr而是num2str。记住英文缩写,我们就可以灵活使用各种函数进行图像转换。

三、利用插值法对图像进行放大处理

1.二维插值

二维插值是对两个变量的函数z = f(x,y)进行插值
求解二维插值的基本思路是:

常见的二维插值可以分为两种:网格结点插值和散乱数据插值。
二维插值处理图片,可以使放大后的图片的失真率降低,提升图片放大后的显示效果。

2.插值问题的出错总结

pic = imread('C:\Users\Good\Pictures\m.jpg');
turn_pic = rgb2gray(pic);
[m,n] = size(turn_pic);
x0 = 1:m;
y0 = 1:n;
x = 1:0.5:(m+0.5);
y = 1:0.5:(n+0.5);
z = interp2(x0,y0,turn_pic,x,y,'cubic');

错误提示

出错原因:x0, y0, X, Y 都是 double 类型的数据,但是 turn_pic 是 uint8 类型的数据。
错误修改turn_pic = double(turn_pic);
修改后运行

错误分析

像这样的插值问题,最怕的就是矩阵的 size 不对应,参照我们插值时可以传入 meshgrid 生成的网格数据,我们不难知道,interp2 的插值方式,内部会自己利用 meshgrid 方式处理传入的数据。但我们知道 meshgrid 方式生成的网格数组与原数据矩阵 size 相反,所以要注意这个 size 问题。以代码为例:

[m,n] = size(turn_pic);
x0 = 1:m;
y0 = 1:n;

传入的 x0,x,y0,y 分别对应的是图像矩阵的行和列,利用 meshgrid 生成的网格面都与 turn_pic 的 size 正好相反。所以我们初始定义 x,x0 对应列,y,y0 对应行,这样就可以避免 size 错误。

正确代码

pic = imread('C:\Users\Good\Pictures\m.jpg');
turn_pic = rgb2gray(pic);
turn_pic = double(turn_pic);
[m,n] = size(turn_pic);
x0 = 1:n;
y0 = 1:m;
x = 1:0.5:(n+0.5);
y = 1:0.5:(m+0.5);
[X,Y] = meshgrid(x,y);
z = interp2(x0,y0,turn_pic,X,Y,'cubic');
z = uint8(z);
imshow(z);

效果图

3.网格点数据的生成

在 matlab 中,进行三维图像的绘制,一般要构造二维的网格面,再通过二维的网格面对应 z 值,绘制出三维的图像。

一般,我们常用 meshgrid 来构建二维的网格面。

meshgrid:二维和三维网格
用法:[X,Y]=meshgrid(x,y)
另一种用法[X,Y]=meshgrid(x) 这等价于 [X,Y]=meshgrid(x,x)
其中 x 为 n 维向量,y 为 m 维向量,x, y 为 m✖n 维的矩阵。它用于产生 “二维变量的网格”。
下面举例说明:

x = 1:4;
y = 1:3;
[X,Y] = meshgrid(x,y);

ndgrid:N 维空间中的矩形网格

用法:
[X1,X2,...,Xn] = ndgrid(x1,x2,...,xn) 复制网格向量 x1,x2,...,xn 以生成 n 维满网格。
[X1,X2,...,Xn] = ndgrid(xg) 指定对所有维度使用单一网格向量 xg。您指定的输出参数的数目决定输出的维度 n。

两者的区别与联系
ndgrid 支持从 1 维到 n 维,而 meshgrid 仅仅限制于 2 维和 3 维。在 2 维以及 3 维中,两个函数的坐标输出是一样的,[X,Y,Z] = meshgrid(x,y,z) 等效于 [Y,X,Z] = ndgrid(y,x,z),不同的地方在于输出数组的形状不一样。例如:x 长度为 m,y 长度为 n,meshgrid 生成的二维网格 size 为 n✖m,而 ndgrid 为 m✖n。

你可能感兴趣的:(Matlab 简单图像处理)