数据挖掘python实现,ID3、Bayes、Kmeans、Apriori、Knn(应付作业版)厂工
ID3在决策树分类中,假设S是训练样本集合,|S|是训练样本数,样本划分为n个不同的类C1,C2,….Cn,这些类的大小分别标记为|C1|,|C2|,…..,|Cn|。则任意样本S属于类Ci的概率为:p(Si)=|Ci|/|S|Entropy(S,A)=∑(|Sv|/|S|)*Entropy(Sv)∑是属性A的所有可能的值v,Sv是属性A有v值的S子集|Sv|是Sv中元素的个数;|S|是S中元素的