numpy中view详解

1、如何判断是否共享内存

方法一:
a = np.arange(50)
b = a.reshape((5, 10))
print (b.base is a)
方法二:
print (np.may_share_memory(a, b))
方法三:
print (b.flags['OWNDATA'])  #False -- apparently this is a view
e = np.ravel(b[:, 2])
print (e.flags['OWNDATA'])  #True -- Apparently this is a new numpy object.

2、view的用法

事实上,没有任何数据类型是固定的,主要取决于如何看待这片数据的内存区域。
在numpy.ndarray.view中,提供对内存区域不同的切割方式,来完成数据类型的转换,而无须要对数据进行额外的copy,来节约内存空间。

例如:

import numpy as np
x = np.arange(10, dtype=np.int)

print 'An integer array:', x
print 'An float array:', x.view(np.float)
输出:
An integer array: [0 1 2 3 4 5 6 7 8 9]
An float array: [  0.00000000e+000   4.94065646e-324   
   9.88131292e-324   1.48219694e-323   1.97626258e-323   
   2.47032823e-323   2.96439388e-323   3.45845952e-323
   3.95252517e-323   4.44659081e-323]
在numpy中np.int和np.float都占32bit,其将原本占4Byte的整型数作为浮点数来解析。
进一步看,

 
    
y = x.view(np.byte)
print y
print x.shape ,y.shape
输出结果为:
array([0, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0, 4, 0, 0, 0, 5, 0, 0,
       0, 6, 0, 0, 0, 7, 0, 0, 0, 8, 0, 0, 0, 9, 0, 0, 0], dtype=int8)
10 ,40 
其将原本10*4Byte的空间,按照1Byte来解析,即40*1Byte,y与x数据共享同一内存区域,数据是相同的,只是解析数据的方式不同而已。

对于连续解析的矩阵,我们可以对其重定形,而对于非连续的区域数据,重定形将产生错误。
例如:
>>> a = np.zeros((10, 2))
# A transpose make the array non-contiguous
>>> b = a.T
# Taking a view makes it possible to modify the shape without modiying the
# initial object.
>>> c = b.view()
>>> c.shape = (20)
AttributeError: incompatible shape for a non-contiguous array
接下来,我们看看numpy.reshape()这个函数:
对于其返回值的解释:
This will be a new view object if possible; otherwise, it will be a copy.
note:It is not always possible to change the shape of an array without copying the data. If you want an error to be raise if the data is copied, you should assign the new shape to the shape attribute of the array.
其返回值可能是一个view,或是一个copy。相应的条件为:
1、返回一个view条件:数据区域连续的时候
2、反之,则返回一个copy
如何知道其返回copy,上文note中说明,如果你要其在返回一个copy时报错的话,改对象形状改变的方式就不能使用reshape函数,而应该直接改变这个array的shape属性。如上例中,c.shape = (20),即产生了一个错误,提示你这个非连续的array。若上例的情况,你使用了c = b.view().reshape(20),此时c为b的一个copy。

当对于一个array进行非连续的slice时,再reshape。如 b = a[ : ,0].reshape(x,y),即截取a的第一列,存入b。此时print (np.may_share_memory(a, b))输出为False,因为b是a子array的一个copy。详细见下例:
a = np.arange(16).reshape(4,4)
b = a[:,0].reshape(2,2)   # a non-contiguous array, create a copy
c = a[:,0].view()         # a non-contiguous array, create a view
d = c.reshape(2,2)        # creat a copy
c.shape = (4,1)           # error incompatible shape for a non-contiguous array
f = a[0,:].reshape(2,2)   # a contiguous array, create a view
print np.may_share_memory(a,b)     # False
print np.may_share_memory(a,c)     # Ture
print np.may_share_memory(c,d)     # False
print np.may_share_memory(a,f)     # True




3、在图像处理中的应用

当需要对输入图像三个通道进行相同的处理时,使用cv2.split和cv2.merge是相当浪费资源的,因为任何一个通道的数据对处理来说都是一样的,我们可以用view来将其转换为一维矩阵后再做处理,这要不需要额外的内存开销和时间开销。
代码如下:
def createFlatView(array):
    """Return a 1D view of an array of any dimensionality."""
    flatView = array.view()
    flatView.shape = array.size
    return flatView



参考内容:
1、 http://stackoverflow.com/questions/7824188/numpy-permanent-changes-to-using-numpy-ndarray-view
2、 http://stackoverflow.com/questions/11524664/how-can-i-tell-if-numpy-creates-a-view-or-a-copy

你可能感兴趣的:(numpy,view,ndarray,Python)