Tensorflow: 数据读取(feed_dict, TFRecord)

Tensorflow有三种读取数据的方式:

  • 定义placeholder占位符,通过feed_dict输入数据,从而实现数据的读取。(注意:程序运行时一定要给placeholder提供数据)
  • 预加载数据:在tensorflow的计算图中,定义常量或变量来保存所有的数据。(这种方法不适合于数据量大的情况,会出现显卡内存不足的情况)
  • 将数据保存到TFRecords文件,程序每次从TFRecords文件去读取数据,相当于每次从磁盘读取数据,适用于数据量大的情况。

这里主要介绍第一种和第三种数据读取方式。

  1. 定义placeholder占位符,通过feed_dict读取数据

  • placeholder有以下两种定义方式:

Tensorflow: 数据读取(feed_dict, TFRecord)_第1张图片

     第一种是直接给出了a的确定shape,在提供数据时,数据的shape只能是[2, 1];第二种方式,适用于模型训练时,训练样本数量不确定的情况,更具有灵活性,提供的数据可以是[2, 1] 也可以是[3, 1]。

  • 通过下面的代码来给placeholder提供数据:

Tensorflow: 数据读取(feed_dict, TFRecord)_第2张图片

其中a_x,b_x和a, b同shape,a_x 和b_x是非张量的数组等形式。

2. 从TFRecords中读取数据

  • 将数据写入TFRecords文件

TFRecords可以保存任意形式的数据,如文本,图像等。(因为时间有限,直接上代码)

Tensorflow: 数据读取(feed_dict, TFRecord)_第3张图片

通过以下代码来调用SeqtoTfrecord类,实现将数据写入TFRecord文件。

Tensorflow: 数据读取(feed_dict, TFRecord)_第4张图片

  • 从TFRecord文件中读取数据

还是直接上代码

Tensorflow: 数据读取(feed_dict, TFRecord)_第5张图片

TFRecord在数据量大时非常适用,并且可以写入多种形式的数据,根据需要保存数据多种属性.

你可能感兴趣的:(Tensorflow: 数据读取(feed_dict, TFRecord))