多模态语义分析_基于概率潜在语义分析的多模态图像检索方法研究与实现_问答库...

随着互联网和数字设备的普及与发展,互联网上的图像等多媒体数据飞速增长。如何从海量数据中迅速检索出符合人们意图的图像已经成为当下的研究热点。基于文本的图像检索仅仅通过图像的相关文本进行检索,没有利用图像内容,而基于内容的图像检索由于受到语义鸿沟的困扰,其检索性能仍然无法令人满意。为了缩小语义鸿沟,研究者们提出了多模态图像检索方法,通过融合图像的文本信息和底层特征进行检索,但是如何实现两种信息的有效融合仍然是现在的研究难点。针对这一问题,本论文研究基于概率潜在语义分析的多模态图像检索。

为了有效地融合不同模态的信息,本文首先提出了基于概率潜在语义分析的无监督多模态图像检索方法。该算法将潜在主题扩展为关于文本单词和图像视觉单词的联合分布,从而实现了文本信息和图像底层特征的有效融合。该算法可以广泛地应用于各种具有文字标注信息的多模态图像检索场景,比如web多模态检索等。由于概率潜在语义分析对初值比较敏感,收敛时间过长,本文在无监督算法的基础上,提出利用数据集中的类别信息对算法进行初始化,有效地降低了算法的训练时间,并进一步提高了检索准确度。该算法适用于特定领域的带有类别标注的多模态图像检索。最后,利用论文提出的多模态图像检索算法实现了多模态图像检索系统,该系统验证了算法的正确性与实用性。

论文为多模态图像检索提供了一种有效融合图像文本信息和底层特征的方法,对改善图像检索性能起到了积极的作用。

你可能感兴趣的:(多模态语义分析)