教程地址:http://deeplearning.net/software/theano/tutorial/adding.html
>>> import numpy >>> import theano.tensor as T >>> from theano import function >>> x = T.dscalar('x') >>> y = T.dscalar('y') >>> z = x + y >>> f = function([x, y], z)
先定义了两个 symbols (Variables);函数 f 的输出为 a numpy.ndarray
with zero dimensions。
当执行 f = function([x, y], z) 这句时,明显停滞了,这个时候 f 正被编译成 C 代码。
这样就创建了 f 函数,使用它:
>>> f(2, 3) array(5.0) >>> numpy.allclose(f(16.3, 12.1), 28.4) True
Step 1
>>> x = T.dscalar('x') >>> y = T.dscalar('y')
T.dscalar
的变量类类型是 “0-dimensional arrays (scalar) of doubles (d)”. It is a Theano Type。
dscalar 不是一个类。 因此,x,y 都不是 dscalar 的实例。 它们是 TensorVariable
的实例。但是把 theano Type dscalar
赋给了x,y 的 type
属性:
>>> type(x) <class 'theano.tensor.var.TensorVariable'> >>> x.type TensorType(float64, scalar) >>> T.dscalar TensorType(float64, scalar) >>> x.type is T.dscalar True
当 T.dscalar 带字符串参数时,字符串是这个变量的名字;名字不是必须的,只是方便调试程序。
Step 2
>>> z = x + y
可以使用 pp function to pretty-print 出:
>>> from theano import pp >>> print(pp(z)) (x + y)
Step 3
最后一步是创建 x,y 为输入,z 为输出的函数:
>>> f = function([x, y], z)
function
的第一个参数为输入变量组成的 list ,第二个参数为单个变量或者变量的 list,为函数的输出。
Note:我们可以使用变量的eval
方法。它虽然不想function()
一样灵活,但是已经足够应付教程中所有需求。这样就不需要 import function()了。
>>> import numpy >>> import theano.tensor as T >>> x = T.dscalar('x') >>> y = T.dscalar('y') >>> z = x + y >>> numpy.allclose(z.eval({x : 16.3, y : 12.1}), 28.4) True
eval() 接收的 {x : 16.3, y : 12.1} 为一个字典,返回表达式的数值结果。
eval()第一次对变量使用时会比较慢,因为它会调用 function() 来编译表达式。后续对相同变量调用 eval() 就会变快了,因为变量缓存了编译好的函数。
唯一的改变是实例化 x,y 时使用 matrix Types:
>>> x = T.dmatrix('x') >>> y = T.dmatrix('y') >>> z = x + y >>> f = function([x, y], z)
以2D arrays为输入使用函数:
>>> f([[1, 2], [3, 4]], [[10, 20], [30, 40]]) array([[ 11., 22.], [ 33., 44.]])
以 NumPy array 为输入:
>>> import numpy >>> f(numpy.array([[1, 2], [3, 4]]), numpy.array([[10, 20], [30, 40]])) array([[ 11., 22.], [ 33., 44.]])
也可以进行 scalars to matrices, vectors to matrices, scalars to vectors 的相加,详见 broadcasting ,类似 matlab 中 repmat 后相加。
如下变量类型可用:
bscalar, bvector, bmatrix, brow, bcol, btensor3, btensor4
wscalar, wvector, wmatrix, wrow, wcol, wtensor3, wtensor4
iscalar, ivector, imatrix, irow, icol, itensor3, itensor4
lscalar, lvector, lmatrix, lrow, lcol, ltensor3, ltensor4
fscalar, fvector, fmatrix, frow, fcol, ftensor3, ftensor4
dscalar, dvector, dmatrix, drow, dcol, dtensor3, dtensor4
cscalar, cvector, cmatrix, crow, ccol, ctensor3, ctensor4
a guide to all types compatible with NumPy arrays may be found here: tensor creation
Note:需要根据电脑情况人工选择 32- or 64-bit integers (i
prefix vs. the l
prefix) and floats (f
prefix vs. the d
prefix).
import theano a = theano.tensor.vector() # declare variable out = a + a ** 10 # build symbolic expression f = theano.function([a], out) # compile function print(f([0, 1, 2]))
[ 0. 2. 1026.]
Modify and execute this code to compute this expression: a ** 2 + b ** 2 + 2 * a * b.
答案:
import theano a = theano.tensor.vector() # declare variable b = theano.tensor.vector() # declare variable out = a ** 2 + b ** 2 + 2 * a * b # build symbolic expression f = theano.function([a, b], out) # compile function print(f([1, 2], [4, 5])) # prints [ 25. 49.]