如表所示交易数据库,其项集 I={a,b,c,d,e},
T | 购买的商品 |
---|---|
t1 | a,b,c,d |
t2 | b,c,e |
t3 | a,b,c,e |
t4 | b,d,e |
t5 | a,b,c,d |
(候选频繁1-项集C1)
I-项集 | 支持数 |
---|---|
{a} | 3 |
{b} | 5 |
{c} | 4 |
{d} | 3 |
{e} | 3 |
(频繁1-项集L1)
I-项集 | 支持数 |
---|---|
{a} | 3 |
{b} | 5 |
{c} | 4 |
{d} | 3 |
{e} | 3 |
(候选频繁2-项集C2)
I-项集 | 支持数 |
---|---|
{a,b} | 3 |
{a,c} | 3 |
{a,d} | 2 |
{a,e} | 1 |
{b,c} | 4 |
{b,d} | 3 |
{b,e} | 3 |
{c,d} | 2 |
{c,e} | 2 |
{d,e} | 1 |
(频繁2-项集L2)
I-项集 | 支持数 |
---|---|
{a,b} | 3 |
{a,c} | 3 |
{a,d} | 2 |
{b,c} | 4 |
{b,d} | 3 |
{b,e} | 3 |
{c,d} | 2 |
{c,e} | 2 |
(候选频繁3-项集C3)
I-项集 | 支持数 |
---|---|
{a,b,c} | 3 |
{a,b,d} | 2 |
{a,b,e} | 1 |
{b,c,d} | 2 |
{b,c,e} | 2 |
(频繁3-项集L3)
I-项集 | 支持数 |
---|---|
{a,b,c} | 3 |
{a,b,d} | 2 |
{b,c,d} | 2 |
{b,c,e} | 2 |
(候选频繁4-项集C4)
I-项集 | 支持数 |
---|---|
{a,b,c,d} | 2 |
{a,b,c,e} | 1 |
(频繁4-项集L4)
I-项集 | 支持数 |
---|---|
{a,b,c,d} | 2 |
无(频繁4-项集L4)
综上所诉:频繁项目集为:{{a},{b},{c},{d},{e},{a,b},{a,c},{a,d},{b,c},{b,d},{b,e},{c,d},{c,e},{a,b,c},{a,b,d},{b,c,d},{b,c,e},{a,b,c,d}}
上面的频繁项目集{{a},{b},{c},{d},{e},{a,b},{a,c},{a,d},{b,c},{b,d},{b,e},{c,d},{c,e},{a,b,c},{a,b,d},{b,c,d},{b,c,e},{a,b,c,d}}
最大频繁项目集:{{b,c,e},{a,b,c,d}}。
还是以上面那个表为例,为看时更加方便,我将上面那个表移了下来。
如表所示交易数据库,其项集 I={a,b,c,d,e},
T | 购买的商品 |
---|---|
t1 | a,b,c,d |
t2 | b,c,e |
t3 | a,b,c,e |
t4 | b,d,e |
t5 | a,b,c,d |
(这里的满足是指大于等于)
超集:如图S1是S2的超集。
Apriori算法的目标是找到最大的K项频繁集