TensorFlow 特征列

TensorFlow 特征列

深度神经网络的输入

深度神经网络可以处理哪类数据?答案当然是数字(例如 tf.float32)。毕竟,神经网络中的每个神经元都会对权重和输入数据执行乘法和加法运算。不过,实际输入数据通常包含非数值(分类)数据。以一个可包含下列三个非数值的 product_class 特征为例:

  • kitchenware
  • electronics
  • sports

机器学习模型一般将分类值表示为简单的矢量,其中 1 表示存在某个值,0 表示不存在某个值。例如,如果将 product_class 设置为 sports,机器学习模型通常将 product_class 表示为 [0, 0, 1],意即:

  • 0kitchenware 不存在
  • 0electronics 不存在
  • 1sports 存在

因此,虽然原始数据可以是数值或分类值,但机器学习模型会将所有特征表示为数字。

参考资料

  1. https://www.tensorflow.org/get_started/feature_columns

你可能感兴趣的:(TensorFlow 特征列)