谁不喜欢花呢?但谁能准确识别出所有花的名字和种类呢?专家说,全世界已发现至少25万种花卉。并且,你知晓花的种类名称,也很难说出关于花的故事来。
日前,微软亚洲研究院推出最新款智能识别应用——“微软识花”。这是位可以随身携带的植物专家,能帮你破解花的秘密。拿出手机,打开App,拍张照片,一键识别,便可随手满足好奇心。据悉,这款App应用范围覆盖了我国的绝大多数花卉。
“对于任何物种的分类都是艰难的。”微软亚洲研究院常务副院长芮勇说,“在App的研发过程中,植物专家对提高花卉识别能力起到了基础支持的作用,这是我们和中国科学院植物研究所多年来学术合作的成果”。中科院植物所不仅提供了260万张花卉识别图片,还提供了经专家鉴定的中国常见花列表。此后,微软亚洲研究院利用先进的技术开发出识别花卉的算法,并把识别结果挑选出来,供植物所专家鉴定。经过两三次迭代的过程,才得到了最终训练机器识别的样本集合。
“这次合作缘于一次机缘巧合。”芮勇介绍说,“2015年,在中科院植物所举办的一次研讨会上,我展示了研究院在计算机视觉方面的最新技术。植物所的专家们对此很感兴趣,希望可以把最新的识别技术应用到我国的植物调研和科研中去。同时,我们也希望借此机会,将精确识别技术在应用中进一步锤炼和创新。大家一拍即可,共同合作迎来了‘微软识花’”。
据悉,这款“微软识花”应用技术的研发背后很有挑战性。相比于常规的识猫识狗等动物识别,花卉不仅种类繁多,还不断涌现出大量形态各异的新品种。“我们多媒体搜索组的研究员们在精确识别技术方面有着长久的积累,正希望做这样具有挑战性的事”。芮勇说,“这款App主要应用了深度学习技术。传统的深度学习技术是一个自下而上的人工智能学习过程,如果我们能加入人类智能,对机器的深度学习进行指导,会大大提升精度和效率,迸发出增强智能的魔力。研究员们在这方面下了很大功夫”。
那么,人类是如何识别出不同种类的花呢?假设,摆在我们面前一朵花的照片:我们首先会注意到这张图片中花出现的区域,并排除周围的草地等干扰项;接下来,会将注意力放在花的关键特性上,通过颜色、形状、大小等特性,可以大致确定出花的类型。
研究员们基于以上人类观察物体、对物体的种类进行判断的过程,独具创新地开发了一个自动的视觉多级注意力模型,能够根据分类学家制定的“界门纲目科属种”的分类系统,一层一层递进,提高识别的准确性。
“具体在识花方面,需要机器对基本层级有一个提前认知。我们先加入一个花卉本身的层级结构,将它作为一种先前验证的知识来指导机器学习。还要考虑到层级的信息,例如,不同科的植物之间会不会有相关性?”芮勇介绍,首先要确定花的“科”,再通过一些细节的特征,例如花瓣的分布、形态等来确定它归于哪个“属”,最后,通过花瓣的颜色、纹理等更为细微的特征来具体判断它属于哪个“种”。一朵花就是这样被计算机识别出来的,当然,每一种花的识别过程也是“因花而异”的。
如果玩腻了识花,“微软识花”还有另一个有趣的功能等待你开掘:识别其它的日常物体。随手拿件衣服、摆个文具来测测这款应用的“智商”,也是挺有趣的事呢!据悉,在常用物体的识别上,采用了微软亚洲研究院最先进的图像识别技术。在内部测试中,识别精度可以达到90%。
谈及“微软识花”的未来走向,芮勇说,“我们十分注重将基础研究成果应用到生活中去,以便为人们真正带来改变”。
为此,微软的研究人员制定了多个发展方向:第一,加入更多花卉的种类,将识别的范围拓展到多个国家,并提供多语言产品以及更多的平台。第二,提高识别的精确度,在学术合作中提升数据库的质量和范围。第三,拓展产品的科普功能,丰富花的知识,提供更多互动功能,拓展人们在博物知识方面的涉猎。第四,努力实现离线版本与在线版本的无缝切换,造福更多开发者。最后,希望该项目能对专业研究者的科学研究带来便利。“让学术研究服务更多的人,一直是我们的目标所在。”芮勇说。