文本分类器

以前处理图像、视频,已经觉得维度够高,而且特征够麻烦的了。可真接触到文本时,才发现文本的更麻烦,大概是我这个人懒。


因为想对已经分好词的数据做一下试验,想找一种更好的分类算法,可一想用字典中所有词作为特征岂不是很浪费维度,于是查了查,看来文本的分类还真有很多猫腻。实现一下特征提取的CHI吧,正好结合前几天写好的tfidf用用。

你可能感兴趣的:(算法)