由Inkyu Sa, ZongYuan Ge, Feras Dayoub, B. Upcroft, Tristan Perez, C. McCool四位学者于2016发表。
摘要:组氨酸增强基因传递系统:最先进的技术本文提出了一种使用深度卷积神经网络进行水果检测的新方法。目标是建立一个准确、快速和可靠的水果检测系统,这是自主农业机器人平台的重要组成部分;它是水果产量估算和自动收获的关键要素。最近在深度神经网络方面的工作导致开发了一种最先进的对象检测器,称为 Faster Region-based CNN (Faster R-CNN)。我们通过迁移学习将该模型用于使用从两种模式获得的图像进行水果检测任务:颜色 (RGB) 和近红外 (NIR)。探索了早期和晚期融合方法以结合多模态(RGB 和 NIR)信息。这导致了一种新颖的多模态 Faster R-CNN 模型,与之前使用 F1 分数的工作相比,该模型实现了最先进的结果,该模型考虑了检测的精度和召回性能从 0.807 提高到 0.838甜椒。除了提高准确性之外,这种方法还可以更快地部署到新水果,因为它需要边界框注释而不是像素级注释(对边界框进行注释大约快一个数量级)。该模型经过重新训练以执行七种水果的检测,整个过程需要四个小时来注释和训练每个水果的新模型。