用tensorflow做CNN_TEXT文本分类时,看到这个API,然后去官网查了一下,再看了一下别的资料,算是明白它的处理方式了。
首先,明确一点,tf.argmax可以认为就是np.argmax。tensorflow使用numpy实现的这个API。
简单的说,tf.argmax就是返回最大的那个数值所在的下标。
这个很好理解,只是tf.argmax()的参数让人有些迷惑,比如,tf.argmax(array, 1)和tf.argmax(array, 0)有啥区别呢?
这里面就涉及到一个概念:axis。上面例子中的1和0就是axis。我先笼统的解释这个问题,设置axis的主要原因是方便我们进行多个维度的计算。
在实例面前,再多的语言都是苍白的呀,上例子!
比如:
test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3], [8, 7, 2]])
np.argmax(test, 0) #输出:array([3, 3, 1]
np.argmax(test, 1) #输出:array([2, 2, 0, 0]
啥意思呢?
test[0] = array([1, 2, 3])
test[1] = array([2, 3, 4])
test[2] = array([5, 4, 3])
test[3] = array([8, 7, 2])
# output : [3, 3, 1]
test[0] = array([1, 2, 3]) #2
test[1] = array([2, 3, 4]) #2
test[2] = array([5, 4, 3]) #0
test[3] = array([8, 7, 2]) #0
这是里面都是数组长度一致的情况,如果不一致,axis最大值为最小的数组长度-1,超过则报错。
当不一致的时候,axis=0的比较也就变成了每个数组的和的比较。
**19-9-3最新更新======**
17年写的随笔,没想到是我最热的一篇~
好长时间没登录了,今天登陆了一下,发现评论挺多。
评论也是让我明白,阅读障碍、跳读和不认真不光是我的毛病,还很普遍~
但是,我的这个思考方式,评论还是有朋友看明白了,点赞~
为了避免一些朋友,被评论误导,直接关网页,我觉得有必要再啰嗦几句多解释一下,佛渡有缘人吧~
tf.argmax就是求最大数值所在下标,有朋友说看评论才知道,我上面明明写着。。。
tf.argmax的很普遍解释就是求行,列上最大,你真觉得这个解释很清晰吗?那我再来一个例子:
test = np.array([[[1, 2, 3], [2, 3, 5],[2, 2, 2]], [[5, 4, 3], [8, 7, 2],[1, 2, 3]], [[5, 4, 6], [10, 7, 30], [1, 2, 3]]])
array([[[ 1, 2, 3],
[ 2, 3, 5],
[ 2, 2, 2]],
[[ 5, 4, 3],
[ 8, 7, 2],
[ 1, 2, 3]],
[[ 5, 4, 6],
[10, 7, 30],
[ 1, 2, 3]]])
np.argmax(test, 0):
array([[1, 1, 2],
[2, 1, 2],
[0, 0, 1]], dtype=int64)
np.argmax(test, 1):
array([[1, 1, 1],
[1, 1, 0],
[1, 1, 1]], dtype=int64)
np.argmax(test, 2):
array([[2, 2, 0],
[0, 0, 2],
[2, 2, 2]], dtype=int64)
那上述那个普遍的解释还行不行,还能绕出来不?