2021-03-16

  • 在阅读了《MT-BioNER: Multi-task Learning for Biomedical Named Entity
    Recognition using Deep Bidirectional Transformers》和《Analyzing the Effect of Multi-task Learning for Biomedical Named Entity Recognition》两篇用多任务学习的方式对生物医学领域做命名实体识别的论文后,我开始的想法是:
    1.先计算不同数据集之间的topic相似度
    2.然后将相似度设置成多任务学习过程中损失函数的权值
  • 在具体写代码的时候,我的想法是为每个数据集选择相似度top2的数据集进行多任务学习,将多任务学习的网络结构设置成3个并列的bilstm-crf的模型,最后的模型拥有3个输入和3个输出
  • 但在具体的实现过程中,我发现了一个问题,keras中的model.fit不能接收长度不一致的数据集作为输入,但每个数据集本身拥有的句子数量肯定是不同的,所以不知道如何才能继续下去??????
  • 想知道是不是多任务学习,模型本身要求如果是多输入的话,样本的数量应该是1:1呢????

你可能感兴趣的:(2021-03-16)