数据科学大作业全记录---weka的实验比较

1. 数据集来源:UCI

http://archive.ics.uci.edu/ml/datasets.html?format=&task=&att=&area=&numAtt=&numIns=&type=&sort=taskUp&view=table

        选择看中的数据集,点击data folder,在保存对应的数据集即可~

        · TXT转CSV小技巧:用excel打开txt文件,选择对应的分割符号,再另存为保存成CSV格式即可用weka打开文件~


2. weka实验

        下载weka后打开experimenter,进行实验即可。下附两个百度文库为weka experimenter使用指南~

https://wenku.baidu.com/view/ac128939a45177232f60a28f.html

https://wenku.baidu.com/view/3fd5f5d6195f312b3169a5cc.html?from=search

数据科学大作业全记录---weka的实验比较_第1张图片

new一个算法实验,并可以保存它,下附一个c4.5实验分支的各选项介绍~

http://blog.csdn.net/buaalei/article/details/7105965

c4.5在weka里对应的算法为J48,cart算法对应simpleCart

SimpleCart算法在weka3.8中并没有自带,需要从Tools-Package Manager下载。

一个小坑:需要才能下载。且在第一次没有成功以后需要找到用户目录下wekaFiles删除installedPackageCache.ser文件然后再次下载。

详见:http://blog.csdn.net/churximi/article/details/51526560


然后就是用experimenter进行实验比较就可以啦~


3. 绘制roc图

roc图的绘制在KnowledgeFlow中进行。参考文章http://blog.csdn.net/y878759487/article/details/54692915

你可能感兴趣的:(数据科学)