开放域文本分类的思考

        针对某个项目,其在线来的数据首先通过规则模型R过滤掉明显不对的部分,然后通过已标注数据通过textcnn训练一个模型A,把规则未过滤掉的用这个训练好的模型来判断,人工对比后分为正负两类,正负两类的数据通过textcnn训练一个模型B。然后线上实际使用时依次通过模型R→B(正类)→A输出最终结果。正类为A模型能准确识别的分类。负类为A不能识别的分类。这样模型的识别能力就把规则模型R和分类模型B的能力结合起来了。

你可能感兴趣的:(文本分类,分类,算法)