1.3 J48决策树分类器的使用

导入glass.arff数据,选择“Classify”中的J48分类器。 

1.3 J48决策树分类器的使用_第1张图片

 

1.3 J48决策树分类器的使用_第2张图片

 点击“start”,等一会儿将会出现运行结果

1.3 J48决策树分类器的使用_第3张图片

表示有30个叶子节点,共有59个节点。 

Correctly Classified Instances         143               66.8224 %
Incorrectly Classified Instances        71               33.1776 %

表示有66.8224%的样例被正确分类了。

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.714    0.174    0.667      0.714    0.690      0.532    0.806     0.667     build wind float
                 0.618    0.181    0.653      0.618    0.635      0.443    0.768     0.606     build wind non-float
                 0.353    0.046    0.400      0.353    0.375      0.325    0.766     0.251     vehic wind float
                 0.000    0.000    0.000      0.000    0.000      0.000    ?         ?         vehic wind non-float
                 0.769    0.010    0.833      0.769    0.800      0.788    0.872     0.575     containers
                 0.778    0.029    0.538      0.778    0.636      0.629    0.930     0.527     tableware
                 0.793    0.022    0.852      0.793    0.821      0.795    0.869     0.738     headlamps
Weighted Avg.    0.668    0.130    0.670      0.668    0.668      0.539    0.807     0.611     

=== Confusion Matrix ===

  a  b  c  d  e  f  g   <-- classified as
 50 15  3  0  0  1  1 |  a = build wind float
 16 47  6  0  2  3  2 |  b = build wind non-float
  5  5  6  0  0  1  0 |  c = vehic wind float
  0  0  0  0  0  0  0 |  d = vehic wind non-float
  0  2  0  0 10  0  1 |  e = containers
  1  1  0  0  0  7  0 |  f = tableware
  3  2  0  0  0  1 23 |  g = headlamps

代表有7种类别的玻璃,对角线矩阵表示正确的分类。

更改配置信息:点击“J48-U-M 2”,将unpruned(未修剪)改成true

1.3 J48决策树分类器的使用_第4张图片

重新点击start,得到新的运行结果。(未修剪的决策树运行的结果)

Correctly Classified Instances         144               67.2897 %
Incorrectly Classified Instances        70               32.7103 %

此时得到正确的分类率为67.2897%>66.8%.

继续更改配置信息:minNumObj:每个叶节点所含实例的最少数量。

我们把它更改为大一点的数字15

1.3 J48决策树分类器的使用_第5张图片

 改之前的数据:(6.0)表示叶节点所含实例的数量

(5.0/1.0)表示这个叶节点包含一个错误的分类实例和5个正确的分类实例。

 Si <= 72.49
|   |   |   |   Ca <= 8.28: build wind non-float (6.0)
|   |   |   |   Ca > 8.28: vehic wind float (5.0/1.0)

更改最小实例为15个过后的结果。此时发现正确的分类率仅仅61.215%,错误的分类比较多,比如(15/6),表示这个叶节点有15个正确的分类,6个错误的分类。

J48 unpruned tree
------------------

Ba <= 0.27
|   Mg <= 2.41
|   |   K <= 0.12: tableware (15.0/6.0)
|   |   K > 0.12: containers (20.0/8.0)
|   Mg > 2.41
|   |   Al <= 1.41
|   |   |   RI <= 1.51727: vehic wind float (16.0/9.0)
|   |   |   RI > 1.51727
|   |   |   |   K <= 0.23: build wind float (27.0/8.0)
|   |   |   |   K > 0.23
|   |   |   |   |   Mg <= 3.66: build wind float (41.0/5.0)
|   |   |   |   |   Mg > 3.66: build wind non-float (16.0/3.0)
|   |   Al > 1.41: build wind non-float (50.0/10.0)
Ba > 0.27: headlamps (29.0/3.0)

Number of Leaves  : 	8

Size of the tree : 	15
Correctly Classified Instances         131               61.215  %

图可视化:右击鼠标,选择“Visualize tree”

1.3 J48决策树分类器的使用_第6张图片

此时我们得到一个可视化的决策树。

1.3 J48决策树分类器的使用_第7张图片

 如果Ba的含量高,则分类为headlamps。

如果Ba的含量低,我们继续看Mg的含量,如果Mg的含量低,我们继续看K的含量,如果K的含量低,则分类为tableware.

点击“more”,将会展示更多关于J48决策树分类器的信息。

1.3 J48决策树分类器的使用_第8张图片

J48分类器的信息 

 

1.3 J48决策树分类器的使用_第9张图片

你可能感兴趣的:(机器学习,weka软件使用)