tf.argmax()以及axis解析

用tensorflow做CNN_TEXT文本分类时,看到这个API,然后去官网查了一下,再看了一下别的资料,算是明白它的处理方式了。

首先,明确一点,tf.argmax可以认为就是np.argmax。tensorflow使用numpy实现的这个API。
  
  简单的说,tf.argmax就是返回最大的那个数值所在的下标。
  
  这个很好理解,只是tf.argmax()的参数让人有些迷惑,比如,tf.argmax(array, 1)和tf.argmax(array, 0)有啥区别呢?
  
  这里面就涉及到一个概念:axis。上面例子中的1和0就是axis。我先笼统的解释这个问题,设置axis的主要原因是方便我们进行多个维度的计算。

在实例面前,再多的语言都是苍白的呀,上例子!

比如:

test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3], [8, 7, 2]])
np.argmax(test, 0)   #输出:array([3, 3, 1]
np.argmax(test, 1)   #输出:array([2, 2, 0, 0]

啥意思呢?

  • axis = 0:
      你就这么想,0是最大的范围,所有的数组都要进行比较,只是比较的是这些数组相同位置上的数:
test[0] = array([1, 2, 3])
test[1] = array([2, 3, 4])
test[2] = array([5, 4, 3])
test[3] = array([8, 7, 2])
# output   :    [3, 3, 1]      
  • axis = 1:
      等于1的时候,比较范围缩小了,只会比较每个数组内的数的大小,结果也会根据有几个数组,产生几个结果。
test[0] = array([1, 2, 3])  #2
test[1] = array([2, 3, 4])  #2
test[2] = array([5, 4, 3])  #0
test[3] = array([8, 7, 2])  #0

这是里面都是数组长度一致的情况,如果不一致,axis最大值为最小的数组长度-1,超过则报错。
  当不一致的时候,axis=0的比较也就变成了每个数组的和的比较。

**19-9-3最新更新======**

17年写的随笔,没想到是我最热的一篇~
好长时间没登录了,今天登陆了一下,发现评论挺多。
评论也是让我明白,阅读障碍、跳读和不认真不光是我的毛病,还很普遍~
但是,我的这个思考方式,评论还是有朋友看明白了,点赞~
为了避免一些朋友,被评论误导,直接关网页,我觉得有必要再啰嗦几句多解释一下,佛渡有缘人吧~

tf.argmax就是求最大数值所在下标,有朋友说看评论才知道,我上面明明写着。。。
tf.argmax的很普遍解释就是求行,列上最大,你真觉得这个解释很清晰吗?那我再来一个例子:

test = np.array([[[1, 2, 3], [2, 3, 5],[2, 2, 2]], [[5, 4, 3], [8, 7, 2],[1, 2, 3]], [[5, 4, 6], [10, 7, 30], [1, 2, 3]]])

array([[[ 1,  2,  3],
        [ 2,  3,  5],
        [ 2,  2,  2]],

       [[ 5,  4,  3],
        [ 8,  7,  2],
        [ 1,  2,  3]],

       [[ 5,  4,  6],
        [10,  7, 30],
        [ 1,  2,  3]]])

np.argmax(test, 0):
array([[1, 1, 2],
   [2, 1, 2],
   [0, 0, 1]], dtype=int64)

 np.argmax(test, 1):
array([[1, 1, 1],
       [1, 1, 0],
       [1, 1, 1]], dtype=int64)
       
 np.argmax(test, 2):
array([[2, 2, 0],
       [0, 0, 2],
       [2, 2, 2]], dtype=int64)

那上述那个普遍的解释还行不行,还能绕出来不?

你可能感兴趣的:(python,tensorflow)