tensorflow 中 tf.strided_slice 函数理解

我们在工程中可能会利用 tensorflow 中的 strided_slice 函数来对向量进行切片,特别是常用于对多维向量的切片,但是官方说明比较晦涩,但是搞不清楚的话,在使用的时候,就不知道如何确定参数,所以在此先把这个函数搞清楚。它的函数原型如下:

tf.strided_slice(
    input_,
    begin,
    end,
    strides=None,
    begin_mask=0,
    end_mask=0,
    ellipsis_mask=0,
    new_axis_mask=0,
    shrink_axis_mask=0,
    var=None,
    name=None
)

它的四个最主要的参数说明如下:

  • input_:要进行切片处理的输入数据
  • begin:开始进行切片的索引,输入为一个 list,分别对应各个维度的开始切片的索引
  • end:终止切片的索引(开区间),输入为一个 list(长度与begin一样),分别对应各个维度的终止切片的索引
  • strides:各个维度进行切片的步长(长度通常与begin和end一致,毕竟对于每个我们要切片的维度,我们都要负责的指定出开始,结尾和步长嘛)

官方的一个例子为:

input = tf.constant([[[1, 1, 1], [2, 2, 2]],
                 [[3, 3, 3], [4, 4, 4]],
                 [[5, 5, 5], [6, 6, 6]]])
out = tf.strided_slice(input, [1, 0, 0], [2, 2, 2], [1, 1, 1])
sess = tf.InteractiveSession()
out.eval()

输出为 [[[3, 3], [4, 4]]]

对这个例子,来进行展开理解,首先,input 数据是一个三维数据,下面这样看应该能清楚一点,从外向内看,分别对应第一维、第二维和第三维:

[
  [
    [1, 1, 1],
    [2, 2, 2]
  ],
  [
    [3, 3, 3],
    [4, 4, 4]
  ],
  [
    [5, 5, 5],
    [6, 6, 6]
  ]
]

我们的 tf.strided_slice 中的 begin 参数为 (1, 0, 0),end 参数为 (2, 2, 2),stride 参数为 (1, 1, 1),即我们要对三个维度都进行切分,我们来逐步来对三个维度进行切分。

  1. 对第一维进行切分,索引从 1 到 2,步长为 1,即我们只取第一个维度的索引为 1 的部分,即取三个二维数组中的第二个,即当前的输出为:
       out1 = 
       [
         [
           [3, 3, 3],
           [4, 4, 4]
         ]
       ]
    
  2. 对第二维进行切分(在第一维切分得到的结果上进行),索引从 0 到 2,步长 为 1,即我们取第二个维度的索引为 0 和 1 的部分,即对二维数组中的两行都取,即当前的输出为:
     out2 = 
     [
       [
         [3, 3, 3],
         [4, 4, 4]
       ]
     ]
    
  3. 对第三维进行切分(在第二维切分得到的结果上进行),索引从 0 到 2,步长 为 1,即我们取第三个维度的索引为 0 和 1 的部分,即对二维数组中的三列取前两列,即当前的输出为:
     out3 = 
     [
       [
         [3, 3], 
         [4, 4]
       ]
     ]
    

这就是我们最后的输出。

你可能感兴趣的:(tensorflow 中 tf.strided_slice 函数理解)