区分multitask(多任务)、multilabel(多标签)、multiclass(多类别)

特征是描述属性
标签用于分类,比如用( x i {x_i} xi, y i {y_i} yi)表示第i个样本, y i {y_i} yi就是标记/标签

在属性/特征中,
属性值包含于——>属性空间,样本空间,输入空间
一个示例、样本称为特征向量,举例:
D={ x 1 {x_1} x1 x 2 {x_2} x2 x 3 {x_3} x3,…, x m {x_m} xm}表示m个示例
每个示例由d个属性描述:
x i {x_i} xi=( x i 1 {x_{i1}} xi1 x i 2 {x_{i2}} xi2,…, x i d {x_{id}} xid
x i {x_i} xi是d维样本空间x的一个向量,或说是样本
x i j {x_{ij}} xij表示第i个样本在第j个属性上的取值

从以上基本概念,能很好明白multitask、multilabel、multiclass的区别:

Multiclass

就是多分类问题,比如年龄预测中把人分为小孩,年轻人,青年人和老年人这四个类别

Multilabel

是多标签分类问题,比如一个新闻稿A可以与{政治,体育,自然}有关,就可以打上这三个标签。而新闻稿B可能只与其中的{体育,自然}相关,就只能打上这两个标签。

Multitask

是把多个相关(related)的任务放在一起学习,同时学习多个任务。比如,猫狗进行分类,可以按大小、颜色同时进行分类。
会涉及一个重要概念:共享表示shared representation
(1)、基于参数的共享(Parameter based):比如基于神经网络的MTL,高斯处理过程。
(2)、基于约束的共享(regularization based):比如均值,联合特征(Joint feature)学习(创建一个常见的特征集合)。

你可能感兴趣的:(机器学习)