数据挖掘复习总结

该掌握的题型有:
1、熟练计算支持度和置信度
计算支持度方法如下:

计算置信度方法如下:

例子如下:
数据挖掘复习总结_第1张图片
2、运用Apriori算法求频繁挖掘项集
方法如下:
数据挖掘复习总结_第2张图片
例题如下:
数据挖掘复习总结_第3张图片
3、运用FP-growth算法求频繁挖掘项集
方法如下:
数据挖掘复习总结_第4张图片
例题如下:
数据挖掘复习总结_第5张图片
数据挖掘复习总结_第6张图片
4、运用k-means算法进行相关题目的计算
数据挖掘复习总结_第7张图片
例题如下:
数据挖掘复习总结_第8张图片
数据挖掘复习总结_第9张图片
数据挖掘复习总结_第10张图片
5、运用DBscan算法进行相关关题目的计算
数据挖掘复习总结_第11张图片
数据挖掘复习总结_第12张图片
例题如下:
数据挖掘复习总结_第13张图片
数据挖掘复习总结_第14张图片
6、贝叶斯朴素算法的相关计算
公式:
数据挖掘复习总结_第15张图片
例题如下:
数据挖掘复习总结_第16张图片
数据挖掘复习总结_第17张图片
7、决策树相关计算
信息增益相关计算:
公式一:
数据挖掘复习总结_第18张图片
公式二:


信息增益计算公式:

例题如下:
数据挖掘复习总结_第19张图片
数据挖掘复习总结_第20张图片
数据挖掘复习总结_第21张图片
信息增益率:
公式一:

公式二:

例题如下:
数据挖掘复习总结_第22张图片
数据挖掘复习总结_第23张图片
gini指数:
公式一:

公式二:

公式三:

例题如下:
数据挖掘复习总结_第24张图片
数据挖掘复习总结_第25张图片
数据挖掘复习总结_第26张图片
数据挖掘复习总结_第27张图片
8、度量各种数据的相异性和相似性
题型一:标称属性的邻近度量
数据挖掘复习总结_第28张图片
例题如下:
数据挖掘复习总结_第29张图片
题型二:二元属性的相异度量
数据挖掘复习总结_第30张图片
例题如下:
数据挖掘复习总结_第31张图片
数据挖掘复习总结_第32张图片
题型三:曼哈坦距离
数据挖掘复习总结_第33张图片
例题如下:
数据挖掘复习总结_第34张图片
数据挖掘复习总结_第35张图片
题型四:欧几里得距离
数据挖掘复习总结_第36张图片
例题如下:
数据挖掘复习总结_第37张图片
数据挖掘复习总结_第38张图片
题型五:上确界距离
数据挖掘复习总结_第39张图片
例题如下:
数据挖掘复习总结_第40张图片
数据挖掘复习总结_第41张图片
题型六:有序变量的邻近性度量
数据挖掘复习总结_第42张图片
例题如下:
数据挖掘复习总结_第43张图片
题型七:混合类型属性的相异性
数据挖掘复习总结_第44张图片
例题如下:
数据挖掘复习总结_第45张图片
数据挖掘复习总结_第46张图片
题型八:余弦相似性
数据挖掘复习总结_第47张图片
例题如下:
数据挖掘复习总结_第48张图片
题型九:基于距离的离群点检测
数据挖掘复习总结_第49张图片
例题如下:
数据挖掘复习总结_第50张图片
数据挖掘复习总结_第51张图片
数据挖掘复习总结_第52张图片
题型十:基于聚类的离群点检测
离群因子定义一计算方法:
数据挖掘复习总结_第53张图片
数据挖掘复习总结_第54张图片
数据挖掘复习总结_第55张图片
离群因子定义二计算方法:
数据挖掘复习总结_第56张图片
数据挖掘复习总结_第57张图片
数据挖掘复习总结_第58张图片
数据挖掘复习总结_第59张图片
离群因子定义三计算方法:
数据挖掘复习总结_第60张图片
数据挖掘复习总结_第61张图片

你可能感兴趣的:(数据挖掘复习总结)