贝叶斯分类在垃圾邮件过滤中的运用

1。贝叶斯分类在Spamassassin中的基本思想。
    如果你使用sa-learn来处理100封含有阴茎增大手术这个关键词的垃圾邮件,那么当Spamassassin在处理包含有阴茎增大手术的关键词的第101封邮件时,贝叶斯分类器就会认为这是一封垃圾邮件,就会增加这封邮件的spam的分值。

2。要知道的一些事
   Byaesian Classifier至少需要1000个垃圾邮件样本才能有效判别是否为垃圾邮件。而在未到达200个垃圾样本之前,Byaesian Classifier是不会有任何作用的。

TO BE CONTINUE!


Resource:
http://wiki.apache.org/spamassassin/BayesInSpamAssassin

你可能感兴趣的:(apache)