tf.einsum 的简化归纳理解

其实tf.einsum的参数归纳来说其实无非只是两种:

1,常规的全连接层实现

result = tf.einsum('mn,nh->mh', left_input, right_input)

2,输出attention matrix的实现

result = tf.einsum('mh,nh->mn', left_input, right_input)

怎么折腾都是这两种,比如

result = tf.einsum('bmn,bnh->bmh', left_input, right_input)
result = tf.einsum('bmh,bnh->bmn', left_input, right_input)

你可能感兴趣的:(TensorFlow)