公司动态

当前位置: 首页 > 新闻动态 > 公司动态

威廉希尔williamhill|深度学习在果蔬病虫害监控中的应用

发布时间:2024-09-04 作者:威廉希尔williamhill 来源: 点击: 字号:

  黄李超,地平线核心算法工程师。2014年毕业于英国帝国理工。回国后任职于百度深度学习研究院,实习期间独立开发出基于全卷积网络深度学习在果蔬病虫害监控中的应用的物体检测算法DenseBox,一举成为百度IDL核心算法,2015年在权威检测数据集FDDB、KITTI排行中稳踞榜首,成为当年算法界的一匹黑马。

深度学习在果蔬病虫害监控中的应用

  在地平线,黄李超先后负责算法研发与优化,以及平台搭建与改良。目前在地平线负责物体检测和图像分割方向。

  “算法可以帮助我们实现很多想法,比如网络爬虫、实时监控,这些会提升我们的生活质感和效率。”于他而言,算法不是脱离日常的空中花园,而是一种移步可达的生活方式。

  探索物体检测前沿算法

  工程师对自己设计的算法总是怀有某种特殊的情感,正如Alphago之父哈萨比斯在Alphago战胜围棋高手李世石时兴奋不已一样,谈及在物体检测领域颇有名气的DenseBox算法的开发,黄李超似乎也有说不完的想法和故事。

  黄李超,负责目标检测和图像分割方向

  设计DenseBox最初的目的,是用深度学习做物体检测,这在当时是十分具有前瞻性的想法。虽然深度学习在2013年左右就被应用于物体检测领域,但其代表性的算法架构却一直不够直接和高效深度学习在果蔬病虫害监控中的应用:早期基于CNN的物体检测方法OverFeat,由于性能和效率问题一直没有得到很好的应用。后来Ross Girshick等人开发的R-CNN算法,虽然在一些数据集上有了更好的表现,但它的缺点也显而易见的——region-proposal通常很多,直接用CNN分类非常耗时;同时,训练需要多个步骤,不够直接。

  在大家仍选择沿用R-CNN方法亦步亦趋时候,2014年冬天,还在百度IDL实习的黄李超不满足于跟随其后,决定开发一套新的物体检测算法。更早的OverFeat检测方法给了他启发:既然在图像上卷积等价于使用滑动窗口分类,为什么不直接使用全卷积网络做整图的物体检测呢?因此,富有创造力的他基于自己的理解,开始了这项前人少有的探索,并为之一往无前。

深度学习在果蔬病虫害监控中的应用

  创造之神果然没有辜负这个年轻人的努力,他做到了,并不断完善原初的设计。抛开固有的束缚,他以先行者的敏捷,首先设计出一套端对端的多任务全卷积模型,直接回归物体出现的置信度以及它的相对位置。同时为了能够更好地处理遮挡严重的物体,提高小物体的召回率,他在检测的网络中引入了上采样层,并融合浅层网络得到的特征,得到更大尺寸的输出层。为了对训练样本进行筛选,降低误检,他还率先使用了Online Hard Negative Mining的策略,这在后来的一些论文中被证实卓有成效。

  目标检测示意图:输入多尺度图像,经过CNN处理,输出目标框 引自:DenseBox: Unifying Landmark Localization with End to End Object Detection

  后来,追求完美的他还对DenseBox进行了一次关键性的优化,让原来的检测网络引出多个分支,大大降低了图像金字塔的规模。这一优化,使得在相同计算量的模型下,原本在GPU上耗时数秒的720P图像的人脸检测,不到一秒即可完成。如果用更小的模型,在CPU也可以做到每秒好几帧的速度。在算法的计算中,时间就是生命,一秒的进步都凝结着无数的心血,而数秒的前进则意味着质的飞越。这一改变成为推动DenseBox落地的“临门一脚”,让它真正在产品线上能够可用。

  DenseBox最先应用在人脸检测上,表现出了很好的性能,后来开始逐步应用于车辆检测等方向。而优化后的DenseBox更是被广泛应用到IDL的相关项目组,如人脸和OCR(光学字符识别)项目,极大提高了检测的准确率,至今仍是百度无人车的重要算法之一。加入地平线后,DenseBox在各个平台上衍生出了多种不同性能和速度的模型,也成为了地平线的核心算法。

  来到地平线之后,黄李超延续其朗逸有为的风格,在工程方面也做出了建设性的成绩。一个月内,他独立搭建了一个跨平台的轻量级CNN预测库,性能达到开源深度学习平台Caffe的两倍。同一个月内,他在ARM平台上进行的定制性优化,较Caffe速度提升了2-6倍。同时,地平线初期落地的所有模型,包括人脸检测模型、人脸属性和关键点定位模型、以及ADAS方向的车辆和行人检测模型,也都由他一手训练。由于经验丰富、工作高效,他用短短一个月的时间实现了别人几个月都难以达成的目标。今年在地平线嵌入式人工智能战略的关键一环中,黄李超作为核心成员参与了地平线第一款芯片CNN模块的设计和算法验证。

  纵观黄李超在人工智能领域的探索历程,DenseBox开发、FDDB/KITTI榜首、深度学习预测库、业界顶尖、地平线芯片,这些似乎都可以成为他身上亮闪闪的标签,却都无法简单地定义这个一直活跃在物体检测领域前沿的探索者,因为这个眼睛里带着光亮的人,有太多的想法和探索的能量,有太多的努力和锐利的锋芒,因而让华丽的辞藻黯然失色。

  科技剑客,随性与执着

  采访黄李超最大的感触就是他的随和与坦然,讲起自己的经历,他时常低头一笑,又闲闲道来。他坦言自己的随性,当年DenseBox虽在2015年初就被早早地开发出来,这一成果比同一时期的Fast(er)-R-CNN系列提前数月,但相关的论文直到9月才在arxiv上发布,究其原因竟是他懒于动笔!

  “当时懒得写,就没有写,直到不得不写了,才写了一篇。”虽然DenseBox落地之始就在权威检测数据集FDDB、KITTI中排列榜首,这一荣誉一直是国内多家公司如百度、小米等争相炫耀的筹码,但性情淡泊的黄李超却显然并不想多谈。“这不过是个测试性能的数据集而已,证明算法性能好就够了,盲目的刷榜并没有意义。”

  

  DenseBox在KITTI上名列榜首,性能远超faster-RCNN和Regrionlets

  但是,他的随性仅仅适用于他的人生观,他对工作的热情恰恰相反,以执着勤奋而著称。在开发DenseBox的时候,同期几乎没有可以参考借鉴的工作,因而所有的内容和算法都需要根据自己的直觉去判断,“需要不断的尝试,如果效果不好,就要分析它的原因。只要认定了这个方法可行,就绝对不能放弃。”正是他的坚持让DenseBox在检测算法领域立稳了脚跟,通过不断的更新和改进,它仍傲踞地平线的核心算法之首。

  他的随性和执着构成了他剑客般的性格,对人生随性而坦然,对技艺执着又精益求精。在科技的时代,他就是挥舞锋芒、披荆斩棘的剑客。

  算法,应当是一种生活方式

  “未来的目标嘛,我希望做出更好的算法,也让自己的算法能够在更大的平台上使用,让自己的成果惠及更多的人。”谈及未来的愿景,黄李超如是说。最近二十年来,我们分别经历了PC互联网、移动互联网的热潮,如今这些热潮已接近尾声,而下一次热潮已紧随而来——人工智能。随着万物互联时代的到来,端上的人工智能将带来巨大的市场机会。尤其是在自动驾驶和智能生活领域,存在于每一个智能设备里的AI芯片会是重中之重。

  在万物互联的人工智能时代,生活将与算法密不可分

  而算法在其中扮演的角色就是,和芯片完美结合,提供软硬结合的嵌入式人工智能解决方案,也以此获得重生和更广阔的应用。这也预示着算法将在不久的未来,潜移默化地成为我们的一种生活方式。

  采访后记

  虽然访谈的过程涉及了一些专业领域的内容,但由于黄李超简洁耐心地科普,作为文科生的我第一次近距离地感受到算法的魅力。在和他的接触中,我也越发觉得他在工作和生活中,简直是“两幅面孔”——生活中的他其实是一个非常“萌”的人。比如他给自己起了一个非常奇怪的微信昵称,叫“烫烫烫”,后来我才了解到这是编程C++过程中出现的乱码汉字编译,也反映出他在生活中有趣的一面。

  对于自己加入地平线的选择,他直言:“我喜欢挑战,简单的事情对我而言没有意思威廉希尔williamhill。”正是秉持着这样的精神,他选择在物体检测和图像分割领域进行进一步的探索,将算法与芯片结合,让理想的灵魂落地。

  恭喜你,进入了文末彩蛋环节!小编带你一探日常生活中的黄李超。

相关文章Related Articles