序列模式挖掘、频繁项集与频繁序列

 

GSP,Spade,FreeSpan,PrefixSpan都是频繁序列挖掘算法

关联规则挖掘的的目标是寻找达到某种程度联系的事物集合,再由其产生相关的关联规则。它并不考虑事物发生的先后顺序。

                                         

序列模式挖掘,就是从一个数据序列(Data Sequence)集合S中找出所有满足用户指定最小支持度的序列。每个这样的序列称为一个频繁序列,或者序列模式。可以看出,序列模式挖掘类似于Apriori算法中的频繁项目集挖掘是类似的,而且你接下来就会发现,帮助我们实现序列模式挖掘的GSP算法和频繁项目集挖掘的算法十分接近,如果你已经理解了频繁项目集挖掘算法,那么就可以很容理解GSP算法。

序列模式挖掘是指从序列数据库中寻找频繁子序列作为模式的知识发现过程,即输入一个序列数据库,输出所有不小于最小支持度的序列的过程。它有广泛的应用领域:预测用户购买行为、预测Web访问模式、预测天气变化、预测时长趋势。

你可能感兴趣的:(机器学习面试,数据科学,数据库,机器学习,python,数据挖掘,深度学习)