sklearn笔记一 datasets基本用法

机器学习:

监督学习
非监督学习
半监督学习
强化学习
遗传算法

datasets

自带数据集
1.1 加载数据集
datasets.load_数据集名字()
sklearn笔记一 datasets基本用法_第1张图片

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris=datasets.load_iris()#加载数据集
iris_X=iris.data#获取X 多个属性
iris_Y=iris.target#获取Y

#print(iris_X[:5,:])
#print(iris_Y)

#将数据划分为训练样本和测试样本 测试30%
X_train,X_test,Y_train,Y_test=train_test_split(iris_X,iris_Y,test_size=0.3)

#创建模型
knn=KNeighborsClassifier()
knn.fit(X_train,Y_train)
print(knn.predict(X_test))
print(Y_test)

1.2 制造数据
datasets.make_模型()

#制作数据 样本量 x多少个 y多少个 噪声大小
X, y = datasets.make_regression(n_samples=100, n_features=2, n_targets=1, noise=10)
plt.scatter(X[:,0], y)
plt.show()

sklearn笔记一 datasets基本用法_第2张图片

你可能感兴趣的:(sklearn笔记一 datasets基本用法)