深度学习tensorflow教程-DNNClassifer

支持原文
http://shuaizhang.tech/2016/12/10/Tensorflow-Tutorial-4-DNNClassifier/

DNNClassifier

从前面的例子可以看出,用Tensorflow在实现深度学习的时候,我们需要实现每一层的细节,对于一些通用的功能来说,很多代码其实是可以重用的。谷歌当然知道这个问题,于是tensorflow有一个更高层次的API—tf.contrib.learn,里面有很多通用的接口。本文介绍的就是其中的DNNClassifier,这次我们使用的是Iris数据集,这个数据集也是一个非常经典的数据集,下一节会介绍这个数据集。

实现步骤:

  1. 将Iris导入tensorflow dataset
  2. 构建一个DNNClassifier
  3. 配置和训练model
  4. 测试分类准确率
  5. 用新的样本进行测试

Iris数据集

Iris数据集是关于三种花的,分别问Iris versicolor, Iris Virginica, Iris Setosa, 下面有三种花的图片:

  • Setosa 左
  • versicolor 中
  • virginica 右

从图片也看出来,三种花特征还是很明显的,实际的数据就是通过4个特征来做分类的。数据结果如下,最后一下代表品种。

Sepal Length Sepal Width Petal Length Petal Width Species
5.1 3.5 1.4 0.2 0
7.0 3.2 4.7 1.4 1

这里程序使用的数据集有总共150条,其中120条做样本,后面30条做测试。数据下载地址:

  • iris_training.csv
  • iris_test.csv

代码实现

{% highlight python %}

import tensorflow as tf
import numpy as np

IRIS_TRAINING = “dataset/iris/iris_training.csv”
IRIS_TEST =”dataset/iris/iris_test.csv”

我的数据有表头,因此需要用要用with_header

training_set = tf.contrib.learn.datasets.base.load_csv_with_header(
filename = IRIS_TRAINING,
target_dtype = np.int,
features_dtype = np.float32,
target_column = 4
)
test_set = tf.contrib.learn.datasets.base.load_csv_with_header(
filename=IRIS_TEST,
target_dtype=np.int,
features_dtype=np.float32,
target_column = 4)

feature_columns = [tf.contrib.layers.real_valued_column(“”,dimension=4)]

classifier = tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
hidden_units=[10,20,10],
n_classes=3,
model_dir=”/logs”)

classifier.fit(x=training_set.data,
y=training_set.target,
steps=2000)

accuracy_score = classifier.evaluate(x=test_set.data,
y=test_set.target)[‘accuracy’]
print(“Accuracy: {0:f}”.format(accuracy_score))

new_samples = np.array([[6.4, 3.2, 4.5, 1.5], [5.8, 3.1, 5.0, 1.7]], dtype=float)
y = list(classifier.predict(new_samples, as_iterable = True))
print(‘Predictions:{}’.format(str(y)))

{% endhighlight %}

Accuracy: 0.966667
Predictions:[1, 2]

Reference

  1. https://en.wikipedia.org/wiki/Iris_flower_data_set

你可能感兴趣的:(数据挖掘,深度学习)