UTC模型遇到相关问题

1.基于多标签、多分类、层次分类问题

三种分类都可以在 UTC 框架下实现,其中 multi-class 需要修改评估代码。

1.multi-label: UTC 默认是 multi-label 形式

  • 数据示例
    {“text_a”: “多标签分类示例”, “choices”: [“体育”, “时政”, “娱乐”, “电影”], “labels”: [2, 3], “text_b”: “”, “question”: “”}

2.hierachical: applications/text_classification/*/few-shot 目录下 hierachical 的代码实现和 multi-label 是相同的,区别是数据层面将多级标签用 ## 分隔符拼接了起来,形式上仍是 multi-label。在 UTC 中也可以使用这种实现,将多级标签直接拼起来,如果只需要分类到细分层级,直接取细分层级效果可能更好。

  • 数据示例
    {“text_a”: “多层次分类示例”, “choices”: [“环境 资质优”, “环境 资质差”, “口味 口感好”, “口味 口感差”], “labels”: [0, 1], “text_b”: “”, “question”: “”}
  1. multi-class: 与上述两种分类的区别是 multi-class 最终分类结果有且只有一个标签。
  • 数据示例
    {“text_a”: “多分类示例”, “choices”: [“体育”, “时政”, “娱乐”], “labels”: 0, “text_b”: “”, “question”: “”}

修改代码部分:原有代码中compute_metrics 函数的 sigmoid 实现 run_train.py 和 run_eval.py 均改为 softmax

def compute_

你可能感兴趣的:(问题合集,深度学习,人工智能,机器学习)