图像识别和图像搜索

  多媒体识别是信息检索中难度较高且需求日益旺盛的一个问题。以图像为例,按照图像检索中使用的信息区分,图像可以分为两类:基于文本的图像检索和基于内容识别的图像检索。基于文本的图像检索完全不分析和利用图像本身的内容,其检索质量完全依赖于与图像关联的文字信息与图像内容的相关性,因此有必要引入基于内容的图像检索。

      基于图片的搜索模式自09年以来在全球各大权威评选中,都被公认为未来几年互联网最有前途的创新应用。随着互联网信息的急剧膨胀,文字搜索这种序列化的搜索模式已经不能满足用户的需求,互联网搜索将拓展到更宽泛、更形象的图片搜索阶段。关于读图时代,李彦宏说,互联网一直以来最主流的应用是搜索,而搜索的主要载体是文字,但现在越来越多的图片被上传到网上,现在图片已经成了内容的一种新形式,“图片内容在互联网的信息量正在超过文字,这当中隐藏着很多值得挖掘的信息”。

      通用图像识别的实现,仰仗的是“像人脑一样思考”的深度学习技术。传统图像搜索只识别对比图像本身,比如颜色、纹理这些要素,而基于深度学习的图像搜索加入了人脸、人的姿态、地理位置、字符等语义特征。百度董事长李彦宏说,目前图像搜索应用中需求表达最多的一个类型与生活方式相关,占到拍照搜索的35.5%,比如拍下箱包衣服搜索网购地址,这种搜索有极高的商业价值;占比第二位的是人脸搜索,比如拍下在街上偶遇的人上传搜索类似照片等。

    国际上已经有很多顶级企业如Google、Bing、Ebay、Amazon等在进军这一领域。Google连续投资或收购了Plink、Pixazza、Like三家公司,累计金额超过1亿2千万美金;苹果则收购了人脸视觉搜索Polar Rose;微软也在Bing上大力推广图像相似搜索。而11月初阿里巴巴集团投资了基于视觉的图片购物搜索淘淘搜。一般企业也在往这边发展,比如南京轻搜信息科技有限公司(www.1000look.com)为客户提供以图搜图的服务,在图像识别和图像相似搜索方面拥有先进的核心技术,能够为提供更好的搜索结果和更高效的搜索速度,并提供针对海量数据的多维度分析。  他们还打造了一个针对图像识别及搜索领域的综合交流平台--有图必应(www.qsooo.com)。平台提供针对图像搜索、识别等应用需求的发布和交流,有能力承接需求研发的个人或公司也可以通过揭榜的方式与需求发布方达成合作意向。

    发展图像搜索技术的终极目的不是识别出景物,而是提供后续的服务。“识别出图像之后,更重要的是通过分析满足用户的需求,比如寻找同款、价格比对等等。芮勇认为,真正的图像实体搜索还未达到普及实用阶段,由于图像搜索需要相应的如摄像头硬件的便利性支持,并具有实际使用场景的移动、户外等多样性特点,它天然地与移动互联网的发展息息相关。随着移动互联网的高速发展,在未来二至五年内,图像搜索将迎来新一轮的应用高潮。

你可能感兴趣的:(图像识别和图像搜索)