TensorFlow

TF高级别API TF.Learn    http://tflearn.org/

从零开始学TF-Learn 

https://blog.csdn.net/u013745804/article/details/78285166

https://blog.csdn.net/u013745804/article/details/78291425


TensorFlow入门

TensorFlow是Google公司2015年11月开源的第二代深度学习框架,是第一代框架DistBelief的改进版本.

TensorFlow支持python和c/c++语言, 可以在cpu或gpu上进行运算, 支持使用virtualenv或docker打包发布.

TensorFlow并不是一个纯粹的神经网络框架, 而是使用数据流图进行数值分析的框架.

TensorFlow使用有向图(graph)表示一个计算任务.图的节点称为ops(operations)表示对数据的处理,图的边flow 描述数据的流向.

该框架计算过程就是处理tensor组成的流. 这也是TensorFlow名称的来源.

TensorFlow使用tensor表示数据. tensor意为张量即高维数组,在python中使用numpy.ndarray表示.

TensorFlow使用Session执行图, 使用Variable维护状态.tf.constant是只能输出的ops, 常用作数据源.


在TensorFlow的世界里,变量的定义和初始化是分开的,所有关于图变量的赋值和计算都要通过tf.Session的run来进行。想要将所有图变量进行集体初始化时应该使用tf.global_variables_initializer


用TensorFlow实现一个简单神经网络

Neural Network Demo powered by tensorflow

import tensorflow as tf

import numpy as np

def make_layer(inputs, in_size, out_size,activate=None):

  weights = tf.Variable(tf.random_normal([in_size, out_size]))

    basis= tf.Variable(tf.zeros([1, out_size]) + 0.1)

  result = tf.matmul(inputs, weights) + basis

    ifactivate is None:

      return result

    else:

      return activate(result)

class BPNeuralNetwork:

    def__init__(self):

      self.input_layer = None

      self.label_layer = None

      self.loss = None

      self.optimizer = None

      self.layers = []

    def train(self, cases, labels, limit=100, learn_rate=0.05):

        #build network

      self.input_layer = tf.placeholder(tf.float32, [None, 2])

      self.label_layer = tf.placeholder(tf.float32, [None, 1])

      self.layers.append(make_layer(self.input_layer, 2, 10,activate=tf.nn.relu))

      self.layers.append(make_layer(self.layers[0], 10, 2, activate=None))

      self.loss = tf.reduce_mean(tf.reduce_sum(tf.square((self.label_layer -self.layers[1])), reduction_indices=[1]))

      self.optimizer =tf.train.GradientDescentOptimizer(learn_rate).minimize(self.loss)

        # do training

      self.session.run(tf.initialize_all_variables())

      for i in range(limit):

          self.session.run(self.optimizer, feed_dict={self.input_layer: cases,self.label_layer: labels})

    defpredict(self, case):

      return self.session.run(self.layers[-1], feed_dict={self.input_layer:case})

    deftest(self):

      x_data = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])

      y_data = np.array([[0, 1, 1, 0]]).transpose()

      test_data = np.array([[0, 1]])

      self.train(x_data, y_data)

      print self.predict(test_data)

def main():

    withtf.Session() as session:

      model = BPNeuralNetwork()

      model.session = session

      model.test()


TensorFlow的reduce_sum()函数


TensorFlow_第1张图片

调用reduce_sum(arg1, arg2)时,参数arg1即为要求和的数据,arg2有两个取值分别为0和1,通常用reduction_indices=[0]或reduction_indices=[1]来传递参数。从上图可以看出,当arg2 = 0时,是纵向对矩阵求和,原来矩阵有几列就得到几个值;相似地,当arg2 = 1时,是横向对矩阵求和;当省略arg2参数时,默认对矩阵所有元素进行求和。

看到这里,函数名的前缀为什么是reduce_其实也就很容易理解了,reduce就是“对矩阵降维”的含义,下划线后面的部分就是降维的方式,在reduce_sum()中就是按照求和的方式对矩阵降维。那么其他reduce前缀的函数也举一反三了,比如reduce_mean()就是按照某个维度求平均值,等等。


E:\Anaconda3\lib\site-packages\h5py\__init__.py:36:FutureWarning: Conversion of the second argument of issubdtype from `float` to`np.floating` is deprecated. In future, it will be treated as `np.float64 ==np.dtype(float).type`. from ._conv import register_converters as_register_converters

anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包,Anaconda的下载文件比较大(约515 MB),如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)。

安装TensorFlow

基于 Anaconda 的安装

Anaconda 是一个集成许多第三方科学计算库的Python 科学计算环境,Anaconda使用 conda 作为自己的包管理工具,同时具有自己的计算环境,类似Virtualenv.

和Virtualenv 一样,不同 Python 工程需要的依赖包,conda 将他们存储在不同的地方。 TensorFlow 上安装的 Anaconda 不会对之前安装的 Python 包进行覆盖.

- 安装Anaconda

- 建立一个 conda 计算环境

- 激活环境,使用conda 安装TensorFlow

- 安装成功后,每次使用TensorFlow 的时候需要激活conda 环境

安装Anaconda :

参考 Anaconda 的下载页面的指导

建立一个 conda 计算环境名字叫tensorflow:

TensorFlow_第2张图片

激活tensorflow环境,然后使用其中的 pip 安装 TensorFlow. 当使用easy_install使用--ignore-installed标记防止错误的产生。


ValueError: Cannot feed value of shape (200,)

for Tensor 'Placeholder_32:0', which has shape '(?, 1)'

I am new to tensorflow. This code isjust for a simple neural network. I think the problem maybe is from:

x_data =np.linspace(-0.5,0.5,200)[:np..newaxis]

I tried to write without [:np.newaxis], but it looks like the same.


1 Answer

Thedefined placeholders (both x and y) are 2-dimensional, so you should reshape the inputarrays to rank 2. Try to add this:

x_data = x_data.reshape([-1,1])

y_data = y_data.reshape([-1,1])


Tensorflow: You must feed a value for placeholder tensor'inputs/y_input' with dtype float and shape

从字面理解是:你必须给占位符y_input喂入一个向量值即赋值


交叉熵(Cross Entropy)是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息,将交叉熵引入计算语言学消岐领域,采用语句的真实语义作为交叉熵的训练集的先验信息,将机器翻译的语义作为测试集后验信息。计算两者的交叉熵,并以交叉熵指导对歧义的辨识和消除。实例表明,该方法简洁有效


tf.reduce_mean

一,tensorflow中有一类在tensor的某一维度上求值的函数。如:

求最大值tf.reduce_max(input_tensor, reduction_indices=None,keep_dims=False, name=None)

求平均值tf.reduce_mean(input_tensor, reduction_indices=None,keep_dims=False, name=None)

举例说明:

# 'x' is [[1., 2.]

          [3., 4.]]

x是一个2维数组,分别调用reduce_*函数如下:

首先求平均值:

tf.reduce_mean(x) ==> 2.5 #如果不指定第二个参数,那么就在所有的元素中取平均值

tf.reduce_mean(x, 0) ==> [2., 3.]

#指定第二个参数为0,则第一维的元素取平均值,即每一列求平均值

tf.reduce_mean(x, 1) ==> [1.5,3.5]  #指定第二个参数为1,则第二维的元素取平均值,即每一行求平均值  同理,还可用tf.reduce_max()求最大值等。


tf.argmax 返回张量在某一维度上最大值的索引值

TensorFlow_第3张图片
图片发自App


TensorFlow_第4张图片
图片发自App


TensorFlow_第5张图片
图片发自App








Colaboratory可以让你在浏览器中运行 TensorFlow 程序

Colaboratory是一种数据分析工具,可将文字、代码和代码输出内容合并到一个协作文档中。

借助 Colaboratory,您只需点击一下鼠标,即可在浏览器中执行 TensorFlow 代码。

Colaboratory 包含很多已被广泛使用的库(例如 matplotlib),因而能够简化数据的可视化过程。

Colaboratory 可与 Google Cloud BigQuery 结合使用。

要运行此程序,请执行以下操作

点击代码块中的任意位置(例如,点击字词 import)。

点击代码块左上角的右向三角图标,或按 ⌘/Ctrl+Enter 键。

程序需要几秒钟才会运行。

整个程序仅包含一个代码块。不过,大部分练习都会包含多个代码块,在这种情况下,您应按从上到下的顺序逐个运行代码块

不按顺序运行代码块通常会导致错误。

实用的键盘快捷键

/Ctrl+mb在当前选择的单元格下方创建一个空白代码单元格

/Ctrl+mi中断单元格的运行

/Ctrl+mh显示所有键盘快捷键列表

要查看关于任何 TensorFlow API 方法的文档,请将光标放置在其左括号的正后方,然后按Tab键:


广播

在数学中,您只能对形状相同的张量执行元素级运算(例如,相加等于)。不过,在 TensorFlow 中,您可以对张量执行传统意义上不可行的运算。TensorFlow支持广播(一种借鉴自 Numpy 的概念)。利用广播,元素级运算中的较小数组会增大到与较大数组具有相同的形状。

张量变形

由于张量加法和矩阵乘法均对运算数施加了限制条件,TensorFlow编程者肯定会频繁改变张量的形状。

您可以使用 tf.reshape 方法改变张量的形状。 例如,您可以将 8x2 张量变形为 2x8 张量或 4x4 张量

变量、初始化和赋值

到目前为止,我们执行的所有运算都是针对静态值(tf.constant)进行的;调用 eval() 始终返回同一结果。在TensorFlow 中可以定义 Variable 对象,它的值是可以更改的。

创建变量时,您可以明确设置一个初始值,也可以使用初始化程序


张量处理器(英语:tensor processing unit,缩写:TPU)是Google为机器学习定制的专用芯片(ASIC),专为Google的深度学习框架TensorFlow而设计。

与图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列(英语:Systolic array)的设计,用来优化矩阵乘法与卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。


Google在2016年的Google I/O年会上首次公布了TPU。不过在此之前TPU已在Google内部的一些项目中使用了一年多,如Google街景服务、RankBrain(英语:RankBrain)以及其旗下DeepMind公司的围棋软件AlphaGo等都用到了TPU。[2][3]而在2017年的Google

I/O年会上,Google又公布了第二代TPU,并将其部署在Google云平台之上。第二代TPU的浮点运算能力高达每秒180万亿次。

第一代

第一代的TPU使用8-bit矩阵乘法引擎,透过PCIe 3.0与CISC指令操作。晶片为28nm制程,die ≤ 331 mm2,700 Mhz,功耗在28至40瓦。

第二代

第二代于2017年五月发表。

第三代

第三代于2018年五月发表。


TensorFlow DNN for regression


from __future__ import absolute_import

from __future__ import division

from __future__ import print_function


import tensorflow as tf

from tensorflow.contrib import learn

import matplotlib.pyplot as plt


from sklearn.pipeline import Pipeline

from sklearn import datasets, linear_model

from sklearn import cross_validation

import numpy as np


boston = learn.datasets.load_dataset('boston')

x, y = boston.data, boston.target

X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(

x, y, test_size=0.2, random_state=42)


total_len = X_train.shape[0]


# Parameters

learning_rate = 0.001

training_epochs = 500

batch_size = 10

display_step = 1

dropout_rate = 0.9

# Network Parameters

n_hidden_1 = 32 # 1st layer number of features

n_hidden_2 = 200 # 2nd layer number of features

n_hidden_3 = 200

n_hidden_4 = 256

n_input = X_train.shape[1]

n_classes = 1


# tf Graph input

x = tf.placeholder("float", [None,13])

y = tf.placeholder("float", [None])


# Create model

def multilayer_perceptron(x, weights, biases):

    #Hidden layer with RELU activation

  layer_1 = tf.add(tf.matmul(x, weights['h1']), biases['b1'])

  layer_1 = tf.nn.relu(layer_1)


    #Hidden layer with RELU activation

  layer_2 = tf.add(tf.matmul(layer_1, weights['h2']), biases['b2'])

  layer_2 = tf.nn.relu(layer_2)


    #Hidden layer with RELU activation

  layer_3 = tf.add(tf.matmul(layer_2, weights['h3']), biases['b3'])

  layer_3 = tf.nn.relu(layer_3)


    #Hidden layer with RELU activation

  layer_4 = tf.add(tf.matmul(layer_3, weights['h4']), biases['b4'])

  layer_4 = tf.nn.relu(layer_4)


    #Output layer with linear activation

  out_layer = tf.matmul(layer_4, weights['out']) + biases['out']

  return out_layer


# Store layers weight & bias

weights = {

    'h1':tf.Variable(tf.random_normal([n_input, n_hidden_1], 0, 0.1)),

    'h2':tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2], 0, 0.1)),

    'h3':tf.Variable(tf.random_normal([n_hidden_2, n_hidden_3], 0, 0.1)),

    'h4':tf.Variable(tf.random_normal([n_hidden_3, n_hidden_4], 0, 0.1)),

  'out': tf.Variable(tf.random_normal([n_hidden_4, n_classes], 0, 0.1))

}

biases = {

    'b1':tf.Variable(tf.random_normal([n_hidden_1], 0, 0.1)),

    'b2':tf.Variable(tf.random_normal([n_hidden_2], 0, 0.1)),

    'b3':tf.Variable(tf.random_normal([n_hidden_3], 0, 0.1)),

    'b4':tf.Variable(tf.random_normal([n_hidden_4], 0, 0.1)),

  'out': tf.Variable(tf.random_normal([n_classes], 0, 0.1))

}


# Construct model

pred = multilayer_perceptron(x, weights,biases)


# Define loss and optimizer

cost = tf.reduce_mean(tf.square(pred-y))

optimizer =tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)


# Launch the graph

with tf.Session() as sess:

  sess.run(tf.initialize_all_variables())


    #Training cycle

    forepoch in range(training_epochs):

      avg_cost = 0.

      total_batch = int(total_len/batch_size)

        #Loop over all batches

      for i in range(total_batch-1):

          batch_x = X_train[i*batch_size:(i+1)*batch_size]

          batch_y = Y_train[i*batch_size:(i+1)*batch_size]

          # Run optimization op (backprop) and cost op (to get loss value)

          _, c, p = sess.run([optimizer, cost, pred], feed_dict={x: batch_x,

                                                        y:batch_y})

          # Compute average loss

          avg_cost += c / total_batch


        #sample prediction

      label_value = batch_y

      estimate = p

      err = label_value-estimate

        print ("num batch:", total_batch)


        #Display logs per epoch step

      if epoch % display_step == 0:

          print ("Epoch:", '%04d' % (epoch+1), "cost=", \

              "{:.9f}".format(avg_cost))

          print ("[*]----------------------------")

          for i in xrange(3):

              print ("label value:", label_value[i], \

                    "estimatedvalue:", estimate[i])

          print ("[*]============================")


    print("Optimization Finished!")


    #Test model

  correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))

    #Calculate accuracy

  accuracy = tf.reduce_mean(tf.cast(correct_prediction,"float"))

    print("Accuracy:", accuracy.eval({x: X_test, y: Y_test}))


TensorFlow回归

在运行到 loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(output,Y))

时,报错:

ValueError: Only call sigmoid_cross_entropy_with_logitswith named arguments (labels=…, logits=…, …)

应该改为

loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=output,logits=Y))


tensorflowtf.random_normaltf.truncated_normal的区别

1、tf.truncated_normal使用方法

tf.truncated_normal(shape, mean=0.0, stddev=1.0,dtype=tf.float32, seed=None, name=None)

从截断的正态分布中输出随机值。生成的值服从具有指定平均值和标准偏差的正态分布,如果生成的值大于平均值2个标准偏差的值则丢弃重新选择。

在正态分布的曲线中,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。横轴区间(μ-2σ,μ+2σ)内的面积为95.449974%。横轴区间(μ-3σ,μ+3σ)内的面积为99.730020%。

X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。在tf.truncated_normal中如果x的取值在区间(μ-2σ,μ+2σ)之外则重新进行选择。这样保证了生成的值都在均值附近。

参数:

shape:一维的张量,也是输出的张量。

mean:正态分布的均值。

stddev:正态分布的标准差。

dtype:输出的类型。

seed:一个整数,当设置之后,每次生成的随机数都一样。

name:操作的名字


2、tf.random_normal使用方法


tf.random_normal(shape, mean=0.0, stddev=1.0,

dtype=tf.float32, seed=None, name=None)

从正态分布中输出随机值。参数:

shape:一维的张量,也是输出的张量。

mean:正态分布的均值。

stddev:正态分布的标准差。

dtype:输出的类型。

seed:一个整数,当设置之后,每次生成的随机数都一样。

name:操作的名字。

代码

a = tf.Variable(tf.random_normal([2,2],seed=1))

b = tf.Variable(tf.truncated_normal([2,2],seed=2))

init = tf.global_variables_initializer()

with tf.Session() as sess:

sess.run(init)

print(sess.run(a))

print(sess.run(b))

输出:

[[-0.81131822  1.48459876]

[ 0.06532937 -2.44270396]]

[[-0.85811085 -0.19662298]

[ 0.13895047 -1.22127688]]


tf.cast TensorFlow中的类型转换函数 cast(x, dtype, name=None) #将x的数据格式转换成dtype


tensorflow中的图上的节点称之为operations或者ops。我们可以使用 graph.get_operations()命令来获取图中的operations.

tf.matrix_solve(matrix, rhs, adjoint=None, name=None)

求解tf.matrix_solve(matrix,rhs, adjoint=None, name=None) matrix为方阵 shape为[M,M], rhs的shape为[M,K],output为[M,K]


Tensorflow:AttributeError: 'module' object has no attribute 'mul'

tensorflow 版本为1.0.1后,

将tf.mul替换为tf.multiply后,错误问题解决。


Tensorflow中随机数生成种子tf.set_random_seed()

Tensorflow中的随机数生成种子是在数据流图资源上运作的。每一个数据流图中,我们可以执行针对随机数生成种子应用不同的操作(operation)。事实上,随机数生成种子作为random系列函数的参数之一,可在相应的参数列表进行设置,这就是op-level的操作。与之对应的是graph-level的操作tf.set_random_seed(),它管理着同一数据流图下的资源。

tensorflow中设置随机种子,可分为两类,图级seed和操作级seed, 情况1:当没有设置图级seed和操作级seed时,生成的随机数是随机的 情况2:当设置操作级seed时,生成的随机数是同一组随机数,没有设置操作级seed的操作,生成的随机数是随机的 情况3:当设置图级seed,将会生成同一组随机数,如果设置操作级seed又和情况2相同

tf.random_normal()函数

用于从服从指定正太分布的数值中取出指定个数的值。

tf.random_normal(shape,mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)

  shape: 输出张量的形状,必选

  mean: 正态分布的均值,默认为0

  stddev: 正态分布的标准差,默认为1.0

  dtype: 输出的类型,默认为tf.float32

  seed: 随机数种子,是一个整数,当设置之后,每次生成的随机数都一样

  name: 操作的名称


tf.random_uniform 函数

从均匀分布中输出随机值。

生成的值在该 [minval,

maxval) 范围内遵循均匀分布。下限 minval 包含在范围内,而上限 maxval 被排除在外。

对于浮点数,默认范围是 [0, 1)。对于整数,至少 maxval 必须明确地指定。

在整数情况下,随机整数稍有偏差,除非 maxval -

minval 是 2 的精确幂。对于maxval - minval的值,偏差很小,明显小于输出(2**32 或者 2**64)的范围。

参数:

shape:一维整数张量或 Python 数组。输出张量的形状。

minval:dtype 类型的 0-D 张量或 Python 值;生成的随机值范围的下限;默认为0。

maxval:dtype 类型的 0-D 张量或 Python 值。要生成的随机值范围的上限。如果 dtype 是浮点,则默认为1 。

dtype:输出的类型:float16、float32、float64、int32、orint64。

seed:一个 Python 整数。用于为分布创建一个随机种子。查看 tf.set_random_seed 行为。

name:操作的名称(可选)。

返回:

用于填充随机均匀值的指定形状的张量。

可能引发的异常:

ValueError:如果 dtype 是整数并且 maxval 没有被指定。


TensorFlow四舍五入:tf.round函数

tf.round 函数

round(x,name=None)

定义在:tensorflow/python/ops/math_ops.py。

请参阅指南:数学函数>基本数学函数

将张量的值四舍五入为最接近的整数,元素。

均匀的舍入。也被称为banker四舍五入。如果要根据当前系统舍入模式进行舍入,请使用tf ::

cint。例如:

x = tf.constant([0.9, 2.5, 2.3, 1.5, -4.5])

tf.round(x)  # [1.0, 2.0, 2.0, 2.0, -4.0 ]

参数:

x:一个Tensor,类型必须为float32或float64。

name:操作的名称(可选)。

返回:

tf.round函数返回一个与x具有相同的形状和类型的Tensor。

tf.round(x,name=None) 舍入最接近的整数

# ‘a’ is [0.9, 2.5, 2.3, -4.4]

tf.round(a) ==> [ 1.0, 3.0, 2.0, -4.0 ]

你可能感兴趣的:(TensorFlow)