ncepu_Chen

TensorFlow学习笔记02:使用tf.data读取和保存数据文件

使用`tf.data`读取和写入数据文件

读取和写入csv文件

写入csv文件
读取csv文件

读取和保存TFRecord文件

TFRecord基础API

`Example`对象的创建和序列化
TFRecord文件的读写

写入TFRecord文件
读取TFRecord文件

使用`tf.data`读取和写入数据文件

准备加州房价数据集并将其标准化:

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 获取房价数据
housing = fetch_california_housing()

# 划分训练集,验证集和测试集
x_train_all, x_test, y_train_all, y_test = train_test_split(housing.data, housing.target)
x_train, x_valid, y_train, y_valid = train_test_split(x_train_all, y_train_all)
print(x_train.shape, y_train.shape)
print(x_valid.shape, y_valid.shape)
print(x_test.shape, y_test.shape)

# 进行数据标准化
scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_valid_scaled = scaler.transform(x_valid)
x_test_scaled = scaler.transform(x_test)

读取和写入csv文件

写入csv文件

将数据集写入到csv文件的代码比较简单,只要使用正常的文件读写即可:

定义函数save_to_csv,将数据写入csv文件中

import numpy as np

def save_to_csv(output_dir, data, name_prefix, header=None, n_parts=10):
    """
    将数据存储到多个csv文件中
    :param output_dir: 存储csv文件的目录
    :param data: 数据
    :param name_prefix: 'train','valid'或'test'
    :param header: csv文件第一行标签
    :param n_parts: csv文件个数
    :return: csv文件路径列表
    """

    filename_format = os.path.join(output_dir, "{}_{:05d}-of-{:05d}.csv")
    filenames = []

    # 生成数据集均分n_parts份的索引,将每一部分存入一个csv文件
    for file_idx, row_indices in enumerate(np.array_split(np.arange(len(data)), n_parts)):
        # 生成csv文件名
        csv_filename = filename_format.format(name_prefix, file_idx, n_parts)
        filenames.append(csv_filename)
        # 写入文件
        with open(csv_filename, "wt", encoding="utf-8") as f:
            if header is not None:  # 写入文件头
                f.write(header + "\n")
            for row_index in row_indices:  # 写入文件内容
                f.write(",".join([repr(col) for col in data[row_index]]))
                f.write('\n')
    return filenames

调用save_to_csv,将train,valid,test数据分别存入多个csv文件中

import os

# 创建存储csv文件的目录
output_dir = "data/generate_csv"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# 准备数据
train_data = np.c_[x_train_scaled, y_train]
valid_data = np.c_[x_valid_scaled, y_valid]
test_data = np.c_[x_test_scaled, y_test]
# 准备header
header_cols = housing.feature_names + ["MidianHouseValue"]
header_str = ",".join(header_cols)

# 将train,valid,test数据存入csv文件
train_filenames = save_to_csv(output_dir, train_data, "train", header_str, n_parts=20)
valid_filenames = save_to_csv(output_dir, valid_data, "valid", header_str, n_parts=10)
test_filenames = save_to_csv(output_dir, test_data, "test", header_str, n_parts=10)

查看生成的csv文件名:

import pprint
print("train filenames:")
pprint.pprint(train_filenames)
print("valid filenames:")
pprint.pprint(valid_filenames)
print("test filenames:")
pprint.pprint(test_filenames)

输出如下:

train filenames:
['data/generate_csv/train_00000-of-00020',
 'data/generate_csv/train_00001-of-00020',
 ...,
 'data/generate_csv/train_00019-of-00020']
valid filenames:
['data/generate_csv/valid_00000-of-00010',
 'data/generate_csv/valid_00001-of-00010',
 ...,
 'data/generate_csv/valid_00009-of-00010']
test filenames:
['data/generate_csv/test_00000-of-00010',
 'data/generate_csv/test_00001-of-00010',
 ...,
 'data/generate_csv/test_00009-of-00010']

读取csv文件

读取csv数据文件的步骤如下:

使用tf.data.Dataset.list_files(file_pattern)获取csv文件名列表

filename_dataset = tf.data.Dataset.list_files(train_filenames)

for filename in filename_dataset:
    print(filename)

输出如下:

tf.Tensor(b'data/generate_csv/train_00019-of-00020.csv', shape=(), dtype=string)
tf.Tensor(b'data/generate_csv/train_00004-of-00020.csv', shape=(), dtype=string)
...
tf.Tensor(b'data/generate_csv/train_00006-of-00020.csv', shape=(), dtype=string)

使用tf.data.TextLineDataset(filename)将csv文件内容转为TextLineDataset,注意使用skip()跳过csv文件的header

dataset = filename_dataset.interleave(lambda filename: tf.data.TextLineDataset(filename).skip(1))	# 使用skip跳过header

for line in dataset.take(15):
    print(line.numpy())

输出如下:

b'0.801544314532886,0.27216142415910205,-0.11624392696666119,-0.2023115137272354,-0.5430515742518128,-0.021039615516440048,-0.5897620622908205,-0.08241845654707416,3.226'
b'0.4853051504718848,-0.8492418886278699,-0.06530126513877861,-0.023379656040017353,1.4974350551260218,-0.07790657783453239,-0.9023632702857819,0.7814514907892068,2.956'
...
b'1.1990412250459561,-0.04823952235146133,0.7491221281727167,0.1308828788491473,-0.060375323994361546,-0.02954897439374466,-0.5524365449182886,0.03243130523751367,5.00001'

使用tf.io.decode_csv(records, record_defaults)解析一行csv文件内容

使用tf.io.decode_csv(records, record_defaults)函数可以解析一行csv文件内容,其中record_defaults字典存储各字段的默认值.

sample_str = '1,2,3,4,5'
record_defaults = [tf.constant(0, dtype=tf.int32), 0, np.nan, "hello", tf.constant([]) ]
parsed_fields = tf.io.decode_csv(sample_str, record_defaults)

print(parsed_fields)

输出如下:

[<tf.Tensor: shape=(), dtype=int32, numpy=1>, 
 <tf.Tensor: shape=(), dtype=int32, numpy=2>, 
 <tf.Tensor: shape=(), dtype=float32, numpy=3.0>, 
 <tf.Tensor: shape=(), dtype=string, numpy=b'4'>, 
 <tf.Tensor: shape=(), dtype=float32, numpy=5.0>]

解析csv数据过程如下:

def parse_csv_line(line, n_fields=9):
    defaults = [tf.constant(np.nan)] * n_fields
    parsed_fields = tf.io.decode_csv(line, record_defaults=defaults)
    x = tf.stack(parsed_fields[0:-1])
    y = tf.stack(parsed_fields[-1:])
    return x, y

dataset = dataset.map(lambda line: parse_csv_line(line, n_fields=9))

# 输出一条数据
print(next(iter(dataset.take(1))))

输出如下

(<tf.Tensor: shape=(8,), dtype=float32, numpy=
 array([-1.119975  , -1.3298433 ,  0.14190045,  0.4658137 , -0.10301778,
        -0.10744184, -0.7950524 ,  1.5304717 ], dtype=float32)>,
 <tf.Tensor: shape=(1,), dtype=float32, numpy=array([0.66], dtype=float32)>)

读取和保存TFRecord文件

TFRecord基础API

TFRecord文件是一种二进制文件,其结构如下:

每条数据由一个tf.Example对象表示
每个Example对象的features属性为一个tf.train.Features对象,其内容为{"key": tf.train.Feature}字典,每个映射表示一个字段,tf.train.Feature字段可以是以下三种类的实例之一:
- tf.train.BytesList: 存储string,byte类型的Tensor.
- tf.train.FloatList: 存储float,double类型的Tensor.
- tf.train.Int64List: 存储bool,enum,int32,uint32,int64,uint64类型的Tensor.

`Example`对象的创建和序列化

下面代码演示Example对象的创建和序列化:

创建三种Fature对象:

# tf.train.BytesList
favorite_books = [name.encode('utf-8') for name in ["machine learning", "cc150"]]
favorite_books_bytelist = tf.train.BytesList(value = favorite_books)
print("favorite_books_bytelist:")
print(favorite_books_bytelist)

# tf.train.FloatList
hours_floatlist = tf.train.FloatList(value = [15.5, 9.5, 7.0, 8.0])
print("hours_floatlist:")
print(hours_floatlist)

# tf.train.Int64List
age_int64list = tf.train.Int64List(value = [42])
print("age_int64list:")
print(age_int64list)

输出如下:

favorite_books_bytelist:
value: "machine learning"
value: "cc150"

hours_floatlist:
value: 15.5
value: 9.5
value: 7.0
value: 8.0

age_int64list:
value: 42

创建Fatures对象:

features = tf.train.Features(
    feature = {
        "favorite_books": tf.train.Feature(bytes_list = favorite_books_bytelist),
        "hours": tf.train.Feature(float_list = hours_floatlist),
        "age": tf.train.Feature(int64_list = age_int64list),
    }
)

print(features)

输出如下:

feature {
  key: "age"
  value {
    int64_list {
      value: 42
    }
  }
}
feature {
  key: "favorite_books"
  value {
    bytes_list {
      value: "machine learning"
      value: "cc150"
    }
  }
}
feature {
  key: "hours"
  value {
    float_list {
      value: 15.5
      value: 9.5
      value: 7.0
      value: 8.0
    }
  }
}

创建tf.train.Example对象:

example = tf.train.Example(features=features)
print(example)

输出如下:

features {
  feature {
    key: "age"
    value {
      int64_list {
        value: 42
      }
    }
  }
  feature {
    key: "favorite_books"
    value {
      bytes_list {
        value: "machine learning"
        value: "cc150"
      }
    }
  }
  feature {
    key: "hours"
    value {
      float_list {
        value: 15.5
        value: 9.5
        value: 7.0
        value: 8.0
      }
    }
  }
}

使用Example对象的SerializeToString()方法将其序列化为字节流:

serialized_example = example.SerializeToString()
print(serialized_example)

输出如下:

b'\n\\\n-\n\x0efavorite_books\x12\x1b\n\x19\n\x10machine learning\n\x05cc150\n\x0c\n\x03age\x12\x05\x1a\x03\n\x01*\n\x1d\n\x05hours\x12\x14\x12\x12\n\x10\x00\x00xA\x00\x00\x18A\x00\x00\xe0@\x00\x00\x00A'

TFRecord文件的读写

使用tf.io.TFRecordWriter对象的write()方法可以将字节流写入TFRecord文件:

filename = "test.tfrecords"
with tf.io.TFRecordWriter(filename) as writer:
    for i in range(3):	# 将同样的三个Example对象写入TFRecords文件
        writer.write(serialized_example)

通过传入tf.io.TFRecordOptions对象可以控制TFRecords文件的压缩类型:

filename = "test.tfrecords.zip"
options = tf.io.TFRecordOptions(compression_type = "GZIP")
with tf.io.TFRecordWriter(filename, options) as writer:
    for i in range(3):	# 将同样的三个Example对象写入TFRecords文件
        writer.write(serialized_example)

使用tf.data.TFRecordDataset将TFRecords文件读取为TFRecordDataset对象,其内容为每个Example对象序列化后的字节流:

dataset = tf.data.TFRecordDataset(["test.tfrecords.zip",], compression_type= "GZIP")
for serialized_example_tensor in dataset:
    print(serialized_example_tensor)

输出如下:

tf.Tensor(b'\n\\\n\x1d\n\x05hours\x12\x14\x12\x12\n\x10\x00\x00xA\x00\x00\x18A\x00\x00\xe0@\x00\x00\x00A\n-\n\x0efavorite_books\x12\x1b\n\x19\n\x10machine learning\n\x05cc150\n\x0c\n\x03age\x12\x05\x1a\x03\n\x01*', shape=(), dtype=string)
tf.Tensor(b'\n\\\n\x1d\n\x05hours\x12\x14\x12\x12\n\x10\x00\x00xA\x00\x00\x18A\x00\x00\xe0@\x00\x00\x00A\n-\n\x0efavorite_books\x12\x1b\n\x19\n\x10machine learning\n\x05cc150\n\x0c\n\x03age\x12\x05\x1a\x03\n\x01*', shape=(), dtype=string)
tf.Tensor(b'\n\\\n\x1d\n\x05hours\x12\x14\x12\x12\n\x10\x00\x00xA\x00\x00\x18A\x00\x00\xe0@\x00\x00\x00A\n-\n\x0efavorite_books\x12\x1b\n\x19\n\x10machine learning\n\x05cc150\n\x0c\n\x03age\x12\x05\x1a\x03\n\x01*', shape=(), dtype=string)

使用tf.io.parse_single_example(serialized_example_tensor, feature_description)方法将序列化后的字节流解析为Tensor字典,其中feature_description字典参数指定各字段类型.

# feature_description指定各字段类型
feature_description = {
    "favorite_books": tf.io.VarLenFeature(dtype = tf.string),
    "hours": tf.io.VarLenFeature(dtype = tf.float32),
    "age": tf.io.FixedLenFeature([], dtype = tf.int64),
}

# 读取TfRecord文件
dataset = tf.data.TFRecordDataset([filename])
for serialized_example_tensor in dataset:
    # 将序列化后的字节流解析为字典
    example = tf.io.parse_single_example(serialized_example_tensor, feature_description)
	print(example)

输出如下:

{'favorite_books': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f7632e8>, 'hours': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f763fd0>, 'age': <tf.Tensor: shape=(), dtype=int64, numpy=42>}
{'favorite_books': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f763f98>, 'hours': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f7639b0>, 'age': <tf.Tensor: shape=(), dtype=int64, numpy=42>}
{'favorite_books': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f763fd0>, 'hours': <tensorflow.python.framework.sparse_tensor.SparseTensor object at 0x7fad1f7632e8>, 'age': <tf.Tensor: shape=(), dtype=int64, numpy=42>}

写入TFRecord文件

将数据集拆分为两个feature,分别是input_features和label

input_features_train = tf.data.Dataset.from_tensor_slices(x_train_scaled)
label_train = tf.data.Dataset.from_tensor_slices(y_train)
dataset_train = tf.data.Dataset.zip((input_features_train, label_train))

序列化一条数据的代码如下:

def serialize_example(x, y):
    """Converts x, y to tf.train.Example and serialize"""
    input_feautres = tf.train.FloatList(value = x)
    label = tf.train.FloatList(value = y)
    features = tf.train.Features(
        feature = {
            "input_features": tf.train.Feature(float_list = input_feautres),
            "label": tf.train.Feature(float_list = label)
        }
    )
    example = tf.train.Example(features = features)
    return example.SerializeToString()

将数据集写入TFRecord文件的代码如下:

def save_to_tfrecords(base_filename, dataset, n_shards, steps_per_shard, compression_type = None):
    options = tf.io.TFRecordOptions(compression_type = compression_type)
    all_filenames = []
    for shard_id in range(n_shards):
        filename = '{}_{:05d}-of-{:05d}'.format(base_filename, shard_id, n_shards)
        with tf.io.TFRecordWriter(filename, options) as writer:
            for x_batch, y_batch in dataset.take(steps_per_shard):
                for x_example, y_example in zip(x_batch, y_batch):
                    writer.write(serialize_example(x_example, y_example))
        all_filenames.append(filename_fullpath)
    return all_filenames

读取TFRecord文件

解析一条字节流的代码如下:

feature_description = {
    "input_features": tf.io.FixedLenFeature([8], dtype=tf.float32),
    "label": tf.io.FixedLenFeature([1], dtype=tf.float32)
}

def parse_example(serialized_example):
    example = tf.io.parse_single_example(serialized_example, feature_description)
    return example["input_features"], example["label"]

读取TFRecord文件的代码如下:

def tfrecords_reader_dataset(filenames, batch_size=32, compression_type=None):
    dataset = tf.data.Dataset.list_files(filenames)
    dataset = dataset.repeat()
    dataset = dataset.interleave(lambda filename: tf.data.TFRecordDataset(filename, compression_type=compression_type))
    dataset.shuffle()
    dataset = dataset.map(parse_example,)
    dataset = dataset.batch(batch_size)
    return dataset

你可能感兴趣的:(TensorFlow学习笔记,TFRecords,tf.data)

一、TensorFlow的建模流程李建军 TensorFlow tensorflow 人工智能 python
1.数据准备与预处理：加载数据：使用内置数据集或自定义数据。预处理：归一化、调整维度、数据增强。划分数据集：训练集、验证集、测试集。转换为Dataset对象：利用tf.data优化数据流水线。importtensorflowastffromtensorflow.kerasimportlayers#加载MNIST数据集(x_train,y_train),(x_test,y_test)=tf.kera
tensorflow学习笔记（二）：机器学习必备API 我愛大泡泡深度学习机器学习深度学习
前一节介绍了一些最基本的概念和使用方法。因为我个人的最终目的还是在深度学习上，所以一些深度学习和机器学习模块是必须要了解的，这其中包括了tf.train、tf.contrib.learn、还有如训练神经网络必备的tf.nn等API。这里准备把常用的API和使用方法按照使用频次进行一个排列，可以当做一个以后使用参考。这一节介绍的内容可以有选择的看。而且最全的信息都在TensorFlow的API里面了
TensorFlow学习笔记 SIENTIST
使用“图”（graph）表示计算任务；在被称为“会话”（session）的“上下文”（context）中执行图；使用“张量”（tensor）表示数据，tensor可以任务是一个n维的数组或列表；通过“变量”（varible）维护状态；使用feed和fetch可以为任意的操作赋值或从中获取数据tensorflow.jpggraph中的节点称为op（operation），每个op能把输入的tensor
政安晨的机器学习笔记——示例演绎在TensorFlow中使用 CSV数据（基于Colab的Jupyter笔记）（1.5万字长文超详细）政安晨政安晨的机器学习笔记机器学习 tensorflow CSV数据处理 Numpy Pandas 深度学习 Colab
本笔记提供了如何在TensorFlow中使用CSV数据的示例：用tf.data加载CSV数据。其中包括两个主要部分：从磁盘加载数据将数据预处理为适合训练的形式。本笔记侧重于加载，并提供了一些关于预处理的快速示例。设置importpandasaspdimportnumpyasnp#Makenumpyvalueseasiertoread.np.set_printoptions(precision=3,
TensorFlow2实战-系列教程8：TFRecords数据源制作1 机器学习杨卓越 TensorFlow tensorflow 人工智能 python TFRecords
TensorFlow2实战-系列教程总目录有任何问题欢迎在下面留言本篇文章的代码运行界面均在JupyterNotebook中进行本篇文章配套的代码资源已经上传1、TFRecords在训练过程中，基本都是使用GPU来计算，但是取一个一个batch取数据还是必须要用cpu，这个过程耗费时间也会影响训练时间，制作TFRecords可以有效解决这个问题，此外制作TFRecords数据可以更好的管理存储数据
TensorFlow2实战-系列教程9：TFRecords数据源制作2 机器学习杨卓越 TensorFlow tensorflow 人工智能 python TFRecords
TensorFlow2实战-系列教程总目录有任何问题欢迎在下面留言本篇文章的代码运行界面均在JupyterNotebook中进行本篇文章配套的代码资源已经上传5、图像数据处理实例5.1读数据importosimportglobfromdatetimeimportdatetimeimportcv2importnumpyasnpimportmatplotlib.pyplotaspltimportmat
一个关于tf.data的简介 cheerss
原视频地址在这儿：https://www.youtube.com/watch?v=uIcqeP7MFH0视频中介绍了tf.data设计的一些原则和一些基本用法。设计的三个原则：1.快速高效tf.data可以在每秒读取13000张图片，官网上有一页专门介绍输入数据pipeline的效率。输入输入的pipeline分为以下三步（ETL）分别是从数据源头处读取数据（Extract）（比如内存，磁盘，远程
tensorflow全新的数据读取方式，DatasetAPI 脏脏包盛
tf.data最佳实践摘要具体理解参考：https://tensorflow.juejin.im/performance/datasets_performance.html以下是设计输入管道的最佳实践总结：使用prefetch转换来合并训练和开销的工作。特别是，我们建议在输入管道的末端添加prefetch(n)（其中n是训练步骤消耗的元素/批次数），以将CPU上执行的转换与加速器上的训练合并。通过
tensorflow学习笔记-图像分类模型-AlexNet实现飞天小小猫
之前一篇文章中总结了CNN中图像分类的经典模型，包括论文解读和分析，但是不写个代码搞一把总觉得虚～啊哈哈这个系列里准备把这些个经典模型用tensorflow实现一下。参考之前引用的blog：深度学习AlexNet模型详细分析上代码吧。参照着模型看更好读一些。'''图像分类模型的tensorflow实现之--AlexNetTensorflowVersion:1.4PythonVersion:3.6R
Tensorflow学习笔记（六）——卷积神经网络七月七叶
实现对fashion-minist分类：（1）引包importosos.environ["CUDA_VISIBLE_DEVICES"]="-1"importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportpandasaspdimportsklearnimportsysimpor
tensorflow vgg基于cifar-10进行训练 GOGOYAO
最近接触tf，想在cifar-10数据集上训练下vgg网络。最开始想先跑vgg16，搜了一大圈，没有一个可以直接跑的（我参考【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg跑出来的精度就10%），要么是代码是针对1000种分类的，要么是预训练好的。最后在Tensorflow学习笔记：CNN篇（6）——CIFAR-10数据集VGG19实现找到了一个vgg19的
深度学习与Tensorflow学习笔记2 ——回调函数callbacks和Tensorboard 木头里有虫911
上一期我们从Fashion-mnist数据集开始，使用Tensorflow.keras搭建一个简单的神经网络来处理分类问题。通过这个简单例子我们熟悉了tf.keras的调用。本期我们来学习keras下面的回调函数callbacks的用法。这里，简单的再说一句，Tensorflow有非常完善的官方文档，相当于学习手册。（而且还有中文网站：https://tensorflow.google.cn/）在
Keras(十四)tf.data读取csv文件并与tf.keras结合使用 TFATS tensorflow nlp keras 机器学习深度学习 nlp keras tensorflow
一，准备csv文件importmatplotlibasmplimportmatplotlib.pyplotaspltimportnumpyasnpimportsklearnimportpandasaspdimportosimportsysimporttimeimporttensorflowastffromtensorflowimportkeras#打印使用的python库的版本信息print(tf
深度学习与神经网络:制作数据集,完成应用(1) 云时之间
在这一篇文章里,我们将继续上一篇文章的工作,并且在上一篇文章的前提下加入数据集的制作,最终我们将完成这个全连接神经网络的小栗子.先说说我们上一篇文章我们的自制数据集的一切缺点,第一,数据集过于分散,在一个文件夹里读取难免导致内存利用率低,而我们将会使用TensorFlow的tfrecords()函数来讲图片和标签制作成这种二进制文件,这样我们的内存利用率会增加不少.将数据保存为tfrecords文
tensorflow综合示例3：对结构化数据进行分类：csv & keras & feature_column jediael_lu 4.Tensorflow tensorflow csv keras
文章目录1、数据集1.1使用Pandas从csv创建一个dataframe1.2将dataframe拆分为训练、验证和测试集1.3用tf.data创建输入流水线Dataset1.4理解输入流水线2、特征列feature_column2.1数值列2.2分桶列2.3分类列2.4嵌入列2.5经过哈希处理的特征列2.6组合的特征列2.7选择要使用的列3、构建&运行模型3.1建立一个新的特征层3.2创建，编
TensorFlow学习笔记--（4）神经网络模型-数据集预处理 Postlude TensorFlow tensorflow 学习笔记
神经网络初步以scikit-leran鸢尾花为例通过scikit-learn库自带的鸢尾花数据集来测试数据的读入fromsklearnimportdatasetsfrompandasimportDataFrameimportpandasaspdx_data=datasets.load_iris().data#.data返回iris数据集所有输入特征y_data=datasets.load_iris
tensorflow学习笔记：识别图中模糊的手写体数字（2）基于多层神经网络以及TensorBoard可视化网络 heart_ace tensorflow学习笔记 tensorflow 神经网络可视化 python 深度学习
tensorflow学习笔记：识别图中模糊的手写体数字（2）基于多层神经网络以及TensorBoard可视化运行环境tensorflow-gpu1.11.0python3.6.9importtensorflowastfimportos读取MINIST数据集fromtensorflow.examples.tutorials.mnistimportinput_datamnist=input_data.
tensorflow读取tfrecords格式文件小小兰哈哈
dataset基本原理：1.写入tfrecords文件：|图片|文字->格式转换->example（tf.train.Example）生成->write(tf.python_io.TFRecordWriter.write)2.读取tfrecords文件：tf.data.dataset加载文件序列->dataset(example迭代器)->tf.parse_single_sample(逐个解析ex
TensorFlow框架-tensorflow IO流程 bingxiash tensorflow
tensorflowIO流程一、队列1、队列与队列管理器（1）队列（2）队列管理器二、文件读取1、文件读取流程2、文件读取API（1）文件队列构造（2）文件阅读器（3）文件内容解码器三、图片处理1、图像基本知识2、图像读取API3、TFRecords分析、存取（1）TFRecords存储（2）TFRecords读取方法（3）Cart-10数据批处理结果存入tfrecords流程(4)读取tfrec
【学习笔记】tensorflow图片读取 weixin_30840573 人工智能
目录图像基本概念图像基本操作图像基本操作API图像读取API狗图片读取CIFAR-10二进制数据读取TFRecordsTFRecords存储TFRecords读取方法图像基本概念在图像数字化表示当中，分为黑白和彩色两种。在数字化表示图片的时候，有三个因素。分别是图片的长、图片的宽、图片的颜色通道数。那么黑白图片的颜色通道数为1，它只需要一个数字就可以表示一个像素位；而彩色照片就不一样了，它有三个颜
tensorflow学习笔记（十）：GAN生成手写体数字（MNIST）陈小虾深度学习框架实战 GAN手写体生成 GAN实战
文章目录一、GAN原理二、项目实战2.1项目背景2.2网络描述2.3项目实战一、GAN原理生成对抗网络简称GAN，是由两个网络组成的，一个生成器网络和一个判别器网络。这两个网络可以是神经网络（从卷积神经网络、循环神经网络到自编码器）。生成器从给定噪声中（一般是指均匀分布或者正态分布）产生合成数据，判别器分辨生成器的的输出和真实数据。前者试图产生更接近真实的数据，相应地，后者试图更完美地分辨真实数据
tensorflow学习笔记3 抬头挺胸才算活着
CreateaTensorFlowobjectthatreturnsx+yifx>y,andx-yotherwise.tf.cond相当于其他编程语言的?，比较要用tf.greatertf.cond(tf.greater(x,y),lambda:tf.add(x,y),lambda:tf.subtract(x,y))tf.case第一个参数是字典或者tuples都可以，只要是一对对，然后每一对第一
Pytorch完整的模型训练套路北山啦 Deep Learning pytorch 人工智能 python
Pytorch完整的模型训练套路文章目录Pytorch完整的模型训练套路以CIFAR10为例实践数据集加载步骤使用适当的库加载数据集，例如torchvision、TensorFlow的tf.data等。将数据集分为训练集和测试集，并进行必要的预处理，如归一化、数据增强等。模型创建步骤创建机器学习模型，可以是深度神经网络、传统机器学习模型或其它模型类型。定义模型架构，包括输入层、隐藏层和输出层的结构
8月10日TensorFlow学习笔记——TensorFlow 数据类型、创建、索引与切片、维度变换、前向传播 Ashen_0nee tensorflow 学习 python
文章目录前言一、Numpy回归问题实战1、Step1：computeloss2、Step2：computeGradientandupdate二、手写数字识别1、Step1：XandY2、Step2：networkstructure3、Step3：循环计算Loss、梯度并更新参数三、数据类型1、tf.constant()2、TensorProperty(1)、.device(2)、.numpy()(
TensorFlow学习笔记--（3）张量的常用运算函数 Postlude TensorFlow tensorflow 学习笔记
损失函数及求偏导通过tf.GradientTape函数来指定损失函数的变量以及表达式最后通过gradient(%损失函数%,%偏导对象%)来获取求偏导的结果独热编码给出一组特征值来对图像进行分类可以用独热编码0的概率是第0种1的概率是第1种0的概率是第二种tf.one_hot(%某标签值%,%分类数%)这里还没太看懂结果的3X3矩阵是怎么来的如果单纯的是因为有几种类型就有几个1那传入的标签值参数就
tensorflow学习笔记--张量和基本运算 Yohance0_0 tensorflow框架学习深度学习
张量张量的阶和数据类型（1）张量的属性：graph：张量所属的默认图op：张量的操作名name：张量的字符串描述shape：张量形状一维{5}二维{2,3}三维{2，3，4}importtensorflowastfimportosos.environ['TF_CPP_MIN_LOG_LEVEL']='2'a=tf.constant(5.0)graph=tf.get_default_graph()p
tensorflow学习笔记----2.常用函数1 qq_35821503 tensorflow 深度学习
1.强制tensor转换为该数据类型tf.cast(张量名，dtype=数据类型)x1=tf.constant([1,2,3],dtype=tf.float64)print(x1)x2=tf.cast(x1,dtype=tf.int32)print("x2=",x2)运行结果：2.计算张量维度上元素的最小值tf.reduce_min(张量名)print("min=",tf.reduce_min(x
TensorFlow学习笔记----3.常用函数2 qq_35821503 tensorflow 深度学习
一.Gradienttape我们可以在with结构中，使用Gradienttape实现某个函数对指定参数的求导运算配合上一个文件讲的variable函数可以实现损失函数loss对参数w的求导计算with结构记录计算过程，gradient求出张量的梯度withtf.GradientTape()astape:若干个计算过程grad=tape.gradient(函数，对谁求导)withtf.Gradie
TensorFlow学习笔记--MLP多层感知机识别手写数字1-9 北航_Curry TensorFlow2.0 tensorflow 神经网络深度学习 1024程序员节
#简单粗暴tensorflow2.0合集视频p7-p9多层感知机（MLP）利用多层感知机MLP实现手写数字0-9的mnist数据集的识别importtensorflowastfimportnumpyasnp#数据的获取和预处理classMNISTLoader():def__init__(self):mnist=tf.keras.datasets.mnist(self.train_data,self
Tensorflow学习笔记--张量与会话 IT修炼家 tensorflow
张量张量是Tensorflow的核心组件之一，可以理解为Tensorflow就是张量和流组成的，张量可以简单地理解为多维数组，我的理解就是张量是一个数据模板，深度学习所有数据首先转换为张量的格式再进行计算，然后得到学习结果。横向看张量是整形、浮点型的数，另外注意张量计算中，有些计算需要张量数据的类型相同，否则会报错。纵向看张量是不同维度的“数组”，零阶张量是一个数，是计算的最小单元；二阶张量是向量
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

TensorFlow学习笔记02:使用tf.data读取和保存数据文件