#TensorFlow实战
鸢尾花数据集的可视化化展示
数据可视化展示能在实验中可视化展出实验结果,是基础部分
鸢尾花数据集是公开的数据集,可通过URL从TensorFlow的Keras连接下载。
代码如下(示例):
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
代码如下(示例):
""" 下载数据集
下载路径: TRAIN_URL = "http://download.tensorflow.org/data/iris_training.csv"
train_path = tf.keras.utils.get_file("iris_training.csv", TRAIN_URL)
"""
# 读入数据集pd.read_csv(filepath_or_buffer,header,names) 路径,列标题,自定义列标题names
COLUMN_NAMES = ['SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth', 'Species']
df_iris = pd.read_csv("C:/Users/lx/.keras/datasets/iris_training.csv",header=0, names=COLUMN_NAMES)
#head()读取前n行数据 tail()是读取后n行 describe()显示二维数据的统计信息
print(df_iris.head())
'''
dataframe的常用属性:ndim,size,shape
可直接转化为数组np.arry() 或者自带的方法:df.values or df.as_matrix()
'''
print(df_iris.ndim, df_iris.shape, df_iris.size)
# 全局设置中文属性,格式是黑体,设置坐标轴能够正常显示负数坐标轴
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
iris = np.array(df_iris)
'''鸢尾花数据集的可视化'''
plt.scatter(iris[:, 2], iris[:, 3],c=iris[:, 4], cmap='brg')
plt.title("鸢尾花数据集分类\n 蓝色--Setosa | 红色——Versicolor | 绿色——Virginia")
plt.xlabel(COLUMN_NAMES[2])
plt.ylabel(COLUMN_NAMES[3])
plt.show()
#设置画布尺寸 4*4大图
fig = plt.figure('Iris Data', figsize=(15,15))
fig.suptitle("鸢尾花数据集分类\n 蓝色--Setosa | 红色——Versicolor | 绿色——Virginia")
for i in range(4):
for j in range(4):
plt.subplot(4, 4, 4*i+(j + 1))
if (i == j):
plt.text(0.3, 0.4, COLUMN_NAMES[i], fontsize=15)
else:
plt.scatter(iris[:, j], iris[:, i], c=iris[:, 4], cmap='brg')
if(i==0):
plt.title(COLUMN_NAMES[j])
if(j==0):
plt.ylabel(COLUMN_NAMES[i])
plt.tight_layout(rect=[0,0,1,0.93])
plt.show()
结果: