Python 实现图像逐像素点取邻域数据

图像比较大的话,在MATLAB上跑起来比较慢,用Python跑就会快很多,贴此备用吧!

#coding=utf-8
import pandas as pd
import numpy as np
from pandas import DataFrame
from matplotlib import pyplot as plt
from matplotlib import image
import scipy
import cv2
import scipy.io as sio

#原始数据四周补0
def pad_data(data,nei_size):
 m,n = data.shape
 t1 = np.zeros([nei_size//2,n])
 data = np.concatenate((t1,data,t1))
 m,n = data.shape
 t2 = np.zeros([m,nei_size//2])
 data = np.concatenate((t2,data,t2),axis=1) 
 return data

#逐像素取大小为nei_size*nei_size的邻域数据
def gen_dataX(data,nei_size):
 x,y = data.shape
 m = x-nei_size//2*2;n = y-nei_size//2*2
 res = np.zeros([m*n,nei_size**2])
 print m,n
 k = 0
 for i in range(nei_size//2,m+nei_size//2):
  for j in range(nei_size//2,n+nei_size//2):
   res[k,:] = np.reshape(data[i-nei_size//2:i+nei_size//2+1,j-nei_size//2:j+nei_size//2+1].T,(1,-1))
   k += 1
 print k
 return res

im = sio.loadmat('data/im1.mat');
im1 = im1['im1']
nei_size=5
#邻域取训练数据
im1= pad_data(im1,nei_size)
data = gen_dataX(im1,nei_size)
sio.savemat("results/"+str(kk)+"/dataX.mat", {'dataX':dataX}) 

补充:像素之间的邻域、连接、连通等问题

1.邻域

邻域分为三类:4邻域、对角邻域和8邻域。

对于以像素P为中心的九宫格而言,一个“加号”所涵盖的四个像素被称为中心像素的4邻域,记作N4(P);角落的四个像素则是对角邻域,记作ND(P);周围全部8个像素称为中心像素的8邻域,记作N8(P)。

Python 实现图像逐像素点取邻域数据_第1张图片

从左到右分别为 4邻域 对角邻域 8邻域

2.连接

两个像素为连接关系需满足两个条件:1.两个像素相互接触(邻接);2.两个像素满足某个特定的相似准则,比如像素灰度值相等或者灰度值处于同一个区间V内,这个是人为设置的。

这里容易把邻接和连接搞混,邻接就只是两个像素相邻而已,连接则需要满足灰度值的要求。

连接根据像素所在邻域的不同也分为三类:4连接、8连接和m连接。先给出它们的定义:

4连接:两个像素P和R都在区间V内,且R属于N4(P);

8连接:两个像素P和R都在区间V内,且R属于N8(P);

m连接:两个像素P和R都在区间V内,且R属于N4(P)或者R属于ND(P),且N4(P)与N4(P)交集中的像素不在V中。

我已经被这堆定义搞晕了,用图片要好理解很多:

Python 实现图像逐像素点取邻域数据_第2张图片

从左到右分别为 4连接、8连接、m连接。

这里假设集合V=1,可以看出8连接和m连接的区别了吧,N4§和N4®的交集(黄色部分)如果在V中,那就是8连接;不在V中就是m连接。

除此之外,根据定义我们也可以发现4连接也是包含在m连接里面的,因此可以得到这样的包含关系:

4连接 ∈ m连接 ∈ 8连接

既然m连接包含在8连接里面了,还定义这个东西干嘛呢?课本给出的原因是为了消除8连接的“二义性”,在下面像素的连通里会用到。

3.连通

连通的定义很简单,就是由一系列连接像素组成的通路。比如这样:

Python 实现图像逐像素点取邻域数据_第3张图片

连通的路线必须是唯一的,但8连接有时候会出现多条路都能走的情况,这时候m连接就派上用场了。

Python 实现图像逐像素点取邻域数据_第4张图片

比如这种情况,蓝色和红色路线都能走,此时我们规定必须要走m连接,那就只剩蓝色路线了。因此m连接的实质就是:在像素间同时存在4-连接和8-连接时,优先采用4-连接,并屏蔽两个和同一像素间存在4-连接的像素之间的8-连接。

这样像素之间的这些关系就都搞明白啦~

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

你可能感兴趣的:(Python 实现图像逐像素点取邻域数据)