【七月份】实验记录_Mixed perceptual language representation model 混合感知语言表示模型
课题思路是构建一种多维度词表示方法,更抽象一点课题属于多模态语言表示研究范畴。具体而言,是想增加词表示嵌入信息量,比如声音和图像信息,而不仅仅是词汇在上下文中的分布信息,这在直观上比较容易理解,数据维度越多,蕴含的信息量就越大。但有一个问题,尽管增加了维度数量/信息含量,最终的词表示是否会提高下游任务的表现?不同维度间信息会不会相互干扰?现在词向量/语言表示模型的评价指标,一般是词相似度(word