机器学习-决策树算法-小白笔记

1 决策树

1.1 认识决策树

机器学习-决策树算法-小白笔记_第1张图片

1.2 决策树分类原理详解

机器学习-决策树算法-小白笔记_第2张图片

机器学习-决策树算法-小白笔记_第3张图片

机器学习-决策树算法-小白笔记_第4张图片

1.2.1 原理

1.2.2 信息熵的定义

机器学习-决策树算法-小白笔记_第5张图片

1.2.3 信息增益

机器学习-决策树算法-小白笔记_第6张图片

机器学习-决策树算法-小白笔记_第7张图片 

机器学习-决策树算法-小白笔记_第8张图片

1.3 决策树API

机器学习-决策树算法-小白笔记_第9张图片

1.4 决策树可视化

1.4.1 保存树的结构到dot文件

机器学习-决策树算法-小白笔记_第10张图片

1.4.2 网站显示结构

http://webgraphviz.com/

机器学习-决策树算法-小白笔记_第11张图片

机器学习-决策树算法-小白笔记_第12张图片

1.5 鸢尾花案例

代码实现

from sklearn.model_selection import train_test_split
from sklearn.datasets import  load_iris
from sklearn.preprocessing import StandardScaler
from sklearn.tree import DecisionTreeClassifier,export_graphviz

def decision():
    """
    用决策树对鸢尾花进行分类
    :return:
    """
    #1 获取数据
    iris=load_iris()

    #2 划分数据集
    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,random_state=5)
    #3 特征抽取
    transfer=StandardScaler()
    x_train=transfer.fit_transform(x_train)
    #跟测试集做一样的处理
    x_test=transfer.transform(x_test)
    #4 算法预估器
    estimator=DecisionTreeClassifier(criterion='entropy')
    estimator.fit(x_train,y_train)
    #5 模型评估
    # 方法1 直接比对真实值和预测值
    y_predict=estimator.predict(x_test)
    print("y_predict:\n",y_predict)
    print("直接比对真实值和预测值:\n",y_test==y_predict)

    # 方法2 计算准确率
    score=estimator.score(x_test,y_test)
    print("准确率:\n",score)
    #可视化决策树
    export_graphviz(estimator,out_file="iris_tress.dot",feature_names=iris.feature_names)


if __name__ == '__main__':
    decision()

机器学习-决策树算法-小白笔记_第13张图片

 

1.6 总结

机器学习-决策树算法-小白笔记_第14张图片

 

 

你可能感兴趣的:(机器学习,Python,决策树算法,机器学习决策树算法,决策树算法python实现)