tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None, validate_indices=True, max_norm=None)
作用:Looks up ids in a list of embedding tensors:也就是说在参数params中查找ids所对应的表示,如果这样的叙述并不清楚,那么参考下边这个简单的例子。
import numpy as np
import tensorflow as tf
sess = tf.InteractiveSession()
embedding = tf.Variable(np.identity(6, dtype=np.int32))
input_ids = tf.placeholder(dtype=tf.int32, shape=[None])
input_embedding = tf.nn.embedding_lookup(embedding, input_ids)
sess.run(tf.global_variables_initializer())
print sess.run(embedding)
print sess.run(input_embedding, feed_dict={input_ids: [4, 0, 2, 4, 5, 1, 3, 0]})
运行结果
jianshu6201.png
从以上简单示例可以看出,embedding将变量表现成了one-hot形式,而input_embedding = tf.nn.embedding_lookup(embedding, input_ids)
就是把input_ids中给出的tensor表现成embedding中的形式。
简单来说上图中红线上部是创建了一个embedding词典,红线下部是通过输入的input_ids查询上部的字典得到embedding后的值。而字典是可以由用户随意创建的,图中给出的是一个one-hot字典,还可以自由创建其他字典,例如使用正态分布或均匀分布产生(0,1)的随机数创建任意维度的embedding字典
如果参数partition_strategy是 "mod",我们把每一个id分配到间隔p的分区中(p = id % len(params))。例如,13个ids划分为5个分区:[[0, 5, 10], [1, 6, 11], [2, 7, 12], [3, 8], [4, 9]]
如果参数partition_strategy是 "div",我们把用连续的方式将ids分配到不同的分区。例如,13个ids划分为5个分区:[[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10], [11, 12]]
作者:加勒比海鲜王
链接:https://www.jianshu.com/p/677e71364c8e
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。