Tensorflow学习笔记(二)

在Tensorflow学习笔记(一)中,我们介绍了tensorflow的主要思想,本节将介绍tensorflow关于矩阵的一些基本运算,他们是构成图的重要元素。

张量基本运算

  1. 加法运算
    在tensorflow中使用加法可以运用重载的'+'和tf.add,要求相加的两个张量维度和数据类型是一致的(如果是矩阵加上标量或者矩阵加上行数相等的行向量或者列数向量的列向量也是合法的)。下面例子说明'+'的默认name是add,tf.add的默认name是Add。
import tensorflow as tf
w1 = tf.Variable(tf.ones([2, 2]), name='w1')
w2 = tf.Variable(tf.ones([2, 2]), name='w2')
w3 = w1+w2
w4 = tf.add(w1, w2)
print(w3, w4)
sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
print(w3.eval(), w4.eval())
>>Tensor("add:0", shape=(2, 2), dtype=float32) Tensor("Add:0", shape=(2, 2), dtype=float32)
[[2. 2.]
 [2. 2.]] [[2. 2.]
 [2. 2.]]
  1. 矩阵乘法
    矩阵乘法要求相乘的两个矩阵必须满足维数要求,且均为2维矩阵。值得注意的是,如果是两个向量相乘,必须指定shape = [1,n]这种形式,否则shape=[n]会报错。例如
w1 = tf.constant([1, 2], shape=[1, 2])
w1_p = tf.constant([1, 2])
w2 = tf.constant([2, 3], shape=[2, 1])
w2_p = tf.constant([1, 2])
# 以下OK
w3 = tf.matmul(w1, w2)
# 以下报错>>Shape must be rank 2 but is rank 1 for 'MatMul_1' (op: 'MatMul') with input shapes: [2], [2].
w3_p = tf.matmul(w1_p, w2_p)

有的时候,为了使得矩阵维度相容,张量可以reshape,例如

import tensorflow as tf
w1_p = tf.reshape(tf.constant([3, 4]), [2, 1])
w2_p = tf.reshape(tf.constant([5, 6]), [1, 2])
w3_p = tf.matmul(w1_p, w2_p)
tf.InteractiveSession()
print(w3_p.eval())
>>[[15 18]
 [20 24]]

另外一个重要的矩阵操作是转置tf.transpose,其使用方法如下

import tensorflow as tf
w1 = tf.reshape(tf.constant([3, 4]), [2, 1])
w2 = tf.transpose(w1, perm=[1, 0])
tf.InteractiveSession()
print(w1.eval(), w2.eval())
>>[[3]
 [4]] [[3 4]]

其中perm是定义的转置之后各个轴的顺序,对二维矩阵的转置来说,perm默认为[1, 0]。如果perm=[0,1]则transpose得到原矩阵。

  1. 元素乘法(点乘)
    两个矩阵元素相乘可以使用tf.multiply或者重载运算符“*”,两者等价。调用方法如下:
import tensorflow as tf
w1 = (tf.constant([3, 4]))
w2 = (tf.constant([5, 6]))
tf.InteractiveSession()
print(tf.multiply(w1, w2).eval())
print((w1*w2).eval())

需要注意的一点是,矩阵元素相乘要求两个矩阵维度是相同的,得到的结果是对应的元素相乘。如果维度不同,要注意以下特殊情况

  • 矩阵点乘向量或者标量,将会自动扩充向量或者标量到与矩阵相同的维度再进行点乘。但要注意向量扩充的时候必须有一个轴的维度是一致的,例如阶矩阵可以和阶列向量点乘(阶列向量会被扩展成阶矩阵,且每列为原列向量),也可以和阶行向量点乘,但是阶矩阵和阶行向量点乘则会报错,因为其无法扩展成相同维度的矩阵。
  • 对于两个不同维度的向量,只允许行向量点乘列向量或者列向量点乘行向量,不允许同为行向量相乘或者同为列向量相乘。阶行向量点乘阶将会得到阶矩阵,即阶行向量被展开成阶矩阵(每行相同),阶列向量被展开成阶矩阵(每列相同)再点积。
  1. 其他运算
    tensorflow提供和numpy一样丰富的矩阵及元素级计算API,包括基本四则运算、矩阵数学函数(如trace、求逆、svd分解等)、规约计算(reduction: 如reduce_sum(input_tensor, axis=none)、reduce_mean等)、累加累积计算、切割操作运算、序列比较与索引提取操作,详细可见运算API解析。
  2. 关系运算
    比较两个维度相同的矩阵,返回相同shape的逻辑矩阵。如下例
w1 = tf.constant([1,2,3])
w2 = tf.constant([1,3,2])
tf.InteractiveSession()
print(tf.equal(w1, w2).eval())
>>[True False False]
print(tf.greater(w1, w2).eval())
>>[False False  True]
print(tf.less(w1, w2).eval())
>>[False  True False]
print(tf.greater_equal(w1, w2).eval())
>>[True False  True]

你可能感兴趣的:(Tensorflow学习笔记(二))