在公园或郊外看到一些很好看的植物,但叫不出名字来,问别人也不一定知道,有没有一款能够帮助识别植物的软件呢,如果是手机版的就更好了。
上周末在公园看到很多花儿在开放,突然想做这么一个软件,大体是这样的:用手机拍下叶子或花的照片,然后该软件识别出一些特征,比对数据库中的植物特征数据,找出相似度最高的一些植物来,显示出文字或图片的说明,比如种类、花期、产地、用途等信息来。需要用到图像识别和人工智能之类的技术。
今天在网上搜索了一下,还真有,就是“植物识别软件-树叶快照Leafsnap”。找了一下相关的资料,整理出来,分享给大家。
我们经常在野外看到一种不知名的植物植物,很想知道它的名字,如果电话请教一位专家,你会发现准确描述这个植物的形状、特点是一件非常难的事情。当然,还有种办法是拍一张照片,然后把它发出来,等专家来告诉你这是什么植物。这样当然没问题,但它仍然不够方便。其实命名是人类认识世界的最基本方式,我们学到的知识也大都是借助“被命名”来完成,也因为这样,知识传递更多的时候仅仅是个单向的过程。所以在没有名字的时候,你会很茫然。
虽然目前这个软件只限于美国本土的植物,并且都是英文版的,而且只有苹果的产品可以下载使用,但是我觉得植物人们的好日子快到了,在不久的将来,中文版的此类软件也会很快开发出来的,反正我是翘首以盼了,科技改变生活,一部智能手机就能带给我们很多的方便。
Peter Belhumeur认为的好办法是做一个叫Leafsnap的App应用。他是美国哥伦比亚大学计算机科学系的教授,他觉得因为不知道这种叶子叫什么,所以眼睁睁看着它而获取不了信息是件痛苦的事。如果大部分植物已经被命名的话(事实上地球上40万种植物大概只有25万种有名字,但这已经是一个相当庞大的数据库),它们应该可以被机器识别出来,就像人脸识别技术那样。他和和他的马里兰大学教授朋友David Jacobs一起成立了Leafsnap研发小组,他们的合作者还有美国史密森协会(Smithsonian Institution)的植物学家John Kress。这些人历时8年拍摄并收集不同种类的树叶,并设计出世界上首款识别植物的移动应用程序。5月15日,它被放上了苹果App Store。
正如这个App的名字所示,Leafsnap的工作原理很简单:把你所见的叶子拍下来,然后系统会自动上传到数据库进行匹配,最后它会反弹出来一串和你观察的叶子样貌类似的植物,包括它们的名字和对应信息。因为加上了地理定位功能,这个应用还能帮你记住你是在哪里饶有兴趣地观察了世界。当然,目前这个应用只对美国东北地区原生植物有准确识别的能力,但这是一个不断成长的数据库。Peter Belhumeur当前最需要解决的问题是,如何找出树叶们具有代表性的图形,因为“世界上没有两片叶子是重样的”(他们想出的办法是,在叶子轮廓的每一个点上估计全轮廓的弯曲率,画出整体柱形图统计,再在不同的外轮都进行重复运算);而且为了辨识准确,目前你需要在一个白色背景下拍摄叶子,这意味着好多“公民科学家”会选择把叶子摘下来,这可不是植物学家鼓励的。
三家著名的学府和机构联手推出了一款应用软件,让人们在欣赏湖光山色的同时,还可以增长知识,今后还会有助于环境保护,那就是起名为“树叶快照”(Leafsnap)的智能移动软件,利用该软件通过手机将拍摄下来的树叶照片上传,你就能知道这种树叫什么名字。
这款软件是哥伦比亚大学、马里兰大学和史密森学会联合开发的,这三个机构的计算机科学家、植物学家和学生,还有华盛顿生物学家野外俱乐部都对它做出了贡献。它是免费的软件,目前可以在iPhone和iPad上下载,不久也会推出基于安致(Android)系统的版本,届时三星、摩托罗拉和索尼爱立信等品牌的手机也可以使用这款软件。
Leafsnap类似于人脸识别。人脸识别属于最困难的图像识别技术,它常常出现在科幻片里,也是刑侦技术的高端手段之一,某些极其敏感的部门将它用于门禁。但是因为不同个体脸部特征的差别可能很小,而且随着年龄变化和不同的表情会出现变化,再加上环境因素例如季节变化和不同光照等,提高利用人脸图像准确认定个体的概率还是一个极具挑战性的课题。目前在现实生活中大规模应用人脸识别还处于探索阶段,通常只是作为智能卡等工具的辅助手段。
Leafsnap的数据库所储存的资料,目前还只包括纽约和华盛顿市附近树种的树叶、叶柄、花、果实和种子以及树皮,不久将扩展到涵盖美国全境的树木。当你在野外或者在自家后院看到一棵不知道名字的树木,如果你的移动设备装载了Leafsnap,就可以将拍下来的树叶照片上传,这套软件将拿你的照片与资料库存进行对比。
与上面所说的人脸识别的困难一样,通过树叶来辨认树种也不容易,因为同一种树的树叶可能形状不完全一样,特别是不同树龄或不同季节,地区不同季节不同也可能形状有差异或颜色变化很大,有的不同种的树叶外形几乎一样。所以系统会在你的手机上显示一组类似的树叶照片,让你从中选择最接近的一种。接着它会提供那片树叶所代表的树种的其他性状图片和资料,由你来最后确认。
你也可以通过该系统上传果实、种子或树皮的照片进行搜索对比,还可以直接输入树木的俗名或学名,就会在你的移动设备上显示出树木的图像来。在你上传图像的时候,手机或iPad的全球定位功能会同时将拍照的地点附带传送出去。随着用户的增加,系统的数据库就会不断更新扩大,将为生物学家、环境保护工作者进行研究提供宝贵的资料,对制定环境政策也会有所帮助。
相关视频:http://v.youku.com/v_show/id_XMjc3NzMyMTE2.html
提供这款软件的网站了解更加详细的情况(http://leafsnap.com/)
这真是“植物”“人”的喜讯啊!
本节资料来自 济南户外爱心网 http://www.hwlove.com/forum.php?mod=viewthread&tid=6180
iPhone的植物识别应用Leafsnap的开发人员apu解释了该软件背后的技术原理。
Q:
Can you just tell us what the recognition tech behind it is?
你能告诉我们这个识别技术背后的原理吗?
A:
apu :Sure! There are 3 main pieces:
apu :当然,主要有3部分:
1. Segment the leaf from the background. Even though we require users to place the leaf on a white background, this is still a very tough problem because of lighting, shadows, viewpoint, blur, focus, etc. We've tried all published segmentation algorithms and nothing works. We wrote our own, using EM on the HSV colorspace as the basis for it (plus lots of heuristics for leaves). It works okay, but it definitely needs the most work.
1.从背景中提取出叶子轮廓。虽然我们要求使用者把叶子放在白色的背景中,但还是会遇到灯光、影子、模糊、聚焦等很棘手的问题。我们尝试了所有公布的分割算法都没有效果。于是我们自己编写了自己的分割算法,以色彩模型HSV的颜色空间上的形长单位EM为基准(加了许多算法)。它运作得很好,当然需要很大的工作量。
2. Extract some features from the contour of the leaf. We use histograms of curvature over scale. The idea is that some leaves have the same rough shape, but differ at a fine scale (e.g., serrated vs. smooth leaves). Others are similar at a fine-scale but look quite different overall. To distinguish all of these cases, we estimate "curvature at a scale" at each point on the contour and build a histogram of curvature values. We then repeat this at coarser and coarser scales and concatenate all histograms together to get a large feature vector.
2.从叶子的轮廓中提取一些特征参数。我们大规模使用曲率直方图。原理是这样的,有些叶子有着大概相同的外形,但是精细的地方存在差别(如叶片是边缘锯齿的或光滑的)。还有些叶片在细节上相同的但是整体上差别很大。为了区分这些情况,我们评估轮廓上每一点的曲率,得出一个曲率值的柱状图。然后大规模的重复这个步骤,然后把所有柱状图联系在一起获得一个大的特征向量。
2. Extract some features from the contour of the leaf. We use histograms of curvature over scale. The idea is that some leaves have the same rough shape, but differ at a fine scale (e.g., serrated vs. smooth leaves). Others are similar at a fine-scale but look quite different overall. To distinguish all of these cases, we estimate "curvature at a scale" at each point on the contour and build a histogram of curvature values. We then repeat this at coarser and coarser scales and concatenate all histograms together to get a large feature vector.
3.识别/匹配:我们用简单的最邻近分类法将特征向量与我们标记的地面真实叶片数据库匹配,给出排名前20左右的物种。
本节资料来自:http://old.dongxi.net/content/bilingual/left/b113M
中国植物图片数据库查询软件
http://www.ylstudy.com/thread-15977-1-4.html
中国被子植物科的交互式检索表
http://www.efloras.org/charset_page.aspx?flora_id=1001&set_id=10059
百度贴吧 如何使识别植物不难?
http://tieba.baidu.com/f?kz=900741440