机器学习笔记--1.6数据可视化

1.表与线性结构的可视化

Python提供四种容器结构--list、dict、set、tuple来装载数据,其中线性结构有两种:list和tuple。由于tuple是只读结构,仅用于外部生成器生成的数据,所以最常用的线性结构就是list。

import numpy as np
import matplotlib.pyplot as plt

#曲线数据加入噪声
x = np.linspace(-5, 5, 200)
y = np.sin(x)
yn = y +np.random.rand(1, len(y)) * 1.5     #加入噪声的点集
#绘图
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(x, yn, c = 'blue', marker = 'o')
ax.plot(x, y + 0.75, 'r')
plt.show()

        输出结果:机器学习笔记--1.6数据可视化_第1张图片

2.数与分类结构的可视化

树状结构是一种非线性结构,一般用于分类树算法,Python使用dict字典型数据结构实现存储。

import numpy as np
import matplotlib.pyplot as plt
import treePlotter as tp

#配置UTF-8输出环境
reload(sys)
sys.setdefaultencoding('utf-8')

#绘制树
myTree = {'root':{0: 'leaf node', 1: {'leval 2': {0: 'leaf node', 1: 'leaf node'}}, 2:{'level2': {0: ';eaf node', 1: 'leaf node'}}}}
tp.createPlot(myTree)

你可能感兴趣的:(机器学习笔记,机器学习,python,数据挖掘)