im2col算法

im2col是一种用来处理矩阵的算法,常用在卷积操作中。对矩阵进行卷积时,需要不断从矩阵中按特定步长截出一定大小的卷积区域。比较常见的卷积核是3*3、5*5左右的。使用传统的for循环进行卷积操作,非常费时,遇到数据量大时,效率十分低下。因为矩阵运算的速度问题已经在计算机中有了非常好的解决算法,因此,如果能把卷积操作转化为矩阵操作,可以明显加快卷积速度。im2col就是因此提出的。
基本原理就是把每个卷积核提取成矩阵中的一行元素,再进行矩阵运算。首先讲一下一些数组操作的知识。在一些程序中会看到数组中有冒号,假设a是一个数组,使用方法如下:
a[n:] a从最后一行往前n+1行
im2col算法_第1张图片
a[:n] a从第一行往后n行
im2col算法_第2张图片
a[:,n] a的第n+1列(返回一个一维数组)
im2col算法_第3张图片
a[n,:] a的第n+1行(返回一个一维数组)
im2col算法_第4张图片
a[:,:] , a[:] , a[::] 返回数组a
说白了,就是返回数组中的部分元素,冒号两边的数字表示返回数组的范围,m:n就是从第m+1个元素到第n个元素,逗号用来分割数组的维度。

使用im2col算法的代码如下:

def im2col(mtx, block_size):
    mtx_shape = mtx.shape
    sx = mtx_shape[0] - block_size[0] + 1
    sy = mtx_shape[1] - block_size[1] + 1
    #初始化转化矩阵。
    result = np.empty((block_size[0] * block_size[1], sx * sy))
    for i in range(sy):
        for j in range(sx):
            #对result的第i*sx+j列赋值。
            result[:, i * sx + j] = mtx[j:j + block_size[0], i:i + block_size[1]].ravel(order='F')
    return result

代码部分使用了一位博主的代码,因此我也知道了数组里冒号的用法。

你可能感兴趣的:(给自己看)