Cousera过程挖掘1-Module1-Association Rule Learning

以下公式主要是用于计算我们的预估值和实际情况的差别

1、Support、Confidence、Lift基础计算

Support计算公式

这里Support的分子指的是同时满足X和Y条件

Confidence计算公式

Lift计算公式

以下是对Lift计算出的具体值的描述:

2、关于一种叫做One is interested in rules的情况

所需满足的条件

3、例子详解

例子

在上面这样的情况下,我们去计算一种情况的规则:


计算

得出的结果

上面的这个计算结果我们参照文首一开始给的公式很容易就能算出来

然后以上面这个为例,我们继续计算其他的情况:


红色格子代表这里算出来的值较低

这里的红色格子中的值这么低,说明相对应的这个相关规则(Association Rule )不是很正确(support值为0.01代表只有1%的人符合这种规律,然),相反,那些绿色格子说明这个规则比较正确

4、蛮力计算法(Brute force approach)

定义两个参数,minsup(minimum support level)mincof(minimum confidence level),
那么:

  • 有某一条rule的support值必须大于minsup值
  • 某一条rule的confidence值必须大于mincof值

如上所示, 这个方法就是我们遍历出所有的可能的相关性(即像前面举的那些例子一样,比如买A的人很有可能会再买B),然后计算每一个相关性的confidence值,如果这个值大于minconf,那么就保留这个相关性规则,否则,删去。
但是这个方法有两个问题:

两个问题

问题2可以认为是得出了太多规则,决策者反而不知道该如何决策。

如何解决问题1的计算问题和问题2的决策问题?


解决方法

你可能感兴趣的:(Cousera过程挖掘1-Module1-Association Rule Learning)