文本分类 tricks

tricks

模型训练好后,分类训练集和验证集中以很高的置信度做出错误决策的样本,然后去做这些bad cases的分析,如果发现错误标注有很强的规律性,则直接写一个脚本纠正(只要确保纠正后的标注正确率比纠正前明显高就行),如果没有什么规律,但是发现模型高置信度做错这些样本大部门都是标注错误的话,就直接删除这些样本,

你可能感兴趣的:(算法,自然语言处理,机器学习)