结构学习:介绍

1. 什么是结构学习

  所谓的结构学习就是输入或者输出是有结构的数据,比如说语句、列表、树和识别时的边界框(bounding box)。而在之前的学习之中,输入和输出都是向量。在结构学习中,我们需要学习的是一个函数 F 。如下图所示,它的输入是一种形式,而输出是另一种形式。

结构学习:介绍_第1张图片

2. 结构学习的应用方向

  主要的应用方向如下

结构学习:介绍_第2张图片

3. 结构学习的统一框架

  结构学习具有一个统一的框架,可以表示为下图中的形式

结构学习:介绍_第3张图片

在训练的过程中,我们希望找到这样的一个函数 f ,用它来评价我们的输入与我们的输出目前有多匹配。在测试的过程中个,给定了一个 x 我们穷举所有的 y 找到使得 F(x,y) 最大的 y 即为测试结果。

3.1 统一框架:目标检测

  目标检测所要达到的目的是。输入一张图片,我们使用一个边界框在图像中标注出确定目标的位置。具体的训练的框架如下所示

结构学习:介绍_第4张图片

在这里训练的过程就是在估计边界框与目标之间的匹配程度。而测试的过程如下图所示

结构学习:介绍_第5张图片

就是穷举所有可能的边界框,从中找出最好的那一个。

3.2 统一框架:生成摘要

  摘要生成的结构学习与上面的目标检测十分相似,首先训练一个函数 F 使得摘要和文本的匹配程度最好,之后在测试阶段,穷举所有的摘要,从中选择得分最高的那一个。

结构学习:介绍_第6张图片

3.3 统一框架:检索问题

  同样的,首先让关键词与搜索结果最匹配,之后在穷举多有可能结果找到最好的那一个。

结构学习:介绍_第7张图片

4. 从统计的角度看待统一框架

  结构学习的统一框架与概率模型之间有着如下的对应关系

结构学习:介绍_第8张图片

其中学习到的函数 F 因为是在评估 x,y 之间的匹配程度的,所以可以认为是 x,y 同时出现的概率;而给定x 找最匹配的结果实际上可以认为是再找给定 x 的一个最大后验概率,所以这个过程实际上课贝叶斯分类的过程是十分相像的。

  但是使用概率的方法有有点也有缺点。优点在于概率模型是可解释的,有意义的;缺点在于并不是多有的东西都可以用概率进行描述,其次对于一个连续函数对所有的可能的结果进行求和是没有办法实现的。

5. 结构学习统一框架要解决的三个问题

  如下图所示

结构学习:介绍_第9张图片

问题1 :估计输入间的相似程度应该用什么方法,也就是说 F(x,y) 应该长成什么样子
问题2:如何解决那个穷举所有找出最大的问题
问题3:给定了训练数据,怎么样找打合适的 F(x,y)
这个过程实际上和下面的隐马尔科夫(HMM)方法要解决的三个问题是相似的

结构学习:介绍_第10张图片

6. 结构学习与DNN之间的关系

  DNN实际上可以看作是结构学习的一个特例,两者之间的关系如下图所示

结构学习:介绍_第11张图片

在上面的神经网络中,我们将 x 输入神经网络中,将输出与 y 做交叉熵,那 F 就是两者交叉熵的相反数,然后在测试的时候,穷举所有的标签,带入 F 中找打使他最大的。

你可能感兴趣的:(机器学习_课程笔记_完结)