关联规则异常点检测

算法思路

  1. 利用Apriori算法,计算闭频繁项集,与频繁项集上满足置信度约束的关联规则
  2. 数据降维
    2.1 记产生的闭频繁项集大小为,对每个闭频繁项集求出相似集
    2.2 对关联规则集中每条规则,求出D中支持r前项和后项的记录集合
    2.3 迭代降维
    • 2.3.1 从闭频繁项集中选取一个子集
    • 2.3.2 利用项集子集生成事务相似集。计算关联规则集与相似集的反映度
    • 2.3.3 迭代得到每个闭频繁项集反映度最高的子集,即目标降维属性子集
  3. 异常点检测
    3.1 计算规则的否定集
    3.2 计算每个否定集中数据点p到簇中与其最邻近的k个数据点中最远点的距离
    3.3 计算数据点p的k关系领域,对中每一点进行判断。计算论文中p的k关系邻域中不符合规则r行为模式点的平均密度,与簇中不符合规则r行为模式点的平均密度比较,实现异常点检测

你可能感兴趣的:(关联规则异常点检测)