bilinear model

bilinear model是一种将多个特征结合起来作为input的方法。比如:对于一个词,他的特征就包括:词性特征,word embedding特征etc. 如果结合多source的特征,就加入了更多信息,实现更有效的表征。
最简单的做法是:

  1. 直接拼接两个特征
  2. 线性组合

bilinear model实现了特征的多通道输入。我们可以设想,人脑可能有一个通道专门处理位置信息,有另一个通道专门处理色彩信息。


bilinear model_第1张图片
bilinear model.png

Specifically, for feature and of picture at location , we compute:



通俗一点讲,bilinear就是对每个位置上的特征进行矩阵相乘,然后进行sum pooling 或者进行max-pooling。对于一个CNN来讲,有个通道数,那么在位置上的特征就是的大小,然后与同一位置上,不同CNN得到的的矩阵进行乘积,得到的矩阵,然后将所有位置上的的矩阵进行求和,再转换成向量的形式就可以得到Bilinear vector。得到的特征需要进行开平方,和归一化操作。
之所以叫bilinear model是因为,固定时,这个变换对于是线性的。

你可能感兴趣的:(bilinear model)