《Improving BERT-Based Text Classification With Auxiliary Sentence and Domain Knowledge》论文笔记
模型模型部分与Bert论文完全一致,只是为分类任务的输入样本构建了“辅助序列”——这种方法只适用于“单序列分类”,对于“语句相似性”等句对分类任务不适用。上图输入部分的aia_iai表示的是人工构建的辅助序列的token。作者提出三种构建“辅助序列”的策略,1)辅助序列是一个不包含标签信息的问句,用BERT4TC-AQ标识;2)辅助序列是只包含一个标签名称的文本描述,用BERT4TC-AA标识;3