常用的两种数据平滑算法

常用的两种数据平滑算法

说明:拉普拉斯平滑算法参看的是中科院王斌老师的现代信息检索ppt

          古德-图灵(Good-Turing)平滑 算法转自:http://hi.baidu.com/kangwp/item/8533124292d026e6bdf45150

平滑算法,就是劫富济贫!!

一、拉普拉斯平滑

        又称为加1平滑,现在针对文本处理为例进行说明:

       常用的两种数据平滑算法_第1张图片,也就是选取的特征数。

二、古德-图灵(Good-Turing)平滑

        古德-图灵(Good-Turing)估计法是很多平滑技术的核心,于1953年有古德(I.J.Good)引用图灵(Turing)的方法而提出来的。其基本思想是:利用频率的类别信息来平滑频率。对于任何发生r次数的n元语法,都假设它发生了r*次。

常用的两种数据平滑算法_第2张图片


你可能感兴趣的:(NLP)