2015年9月,清华大学电子系马惠敏副教授三维图像研究组,在自动驾驶场景下的物体检测国际评测中取得了优异的成绩,全部六项指标中的四项获得第一,两项获得第三。来自百度、斯坦福、NEC研究院、UCLA等多个机构和研究组参加了该评测。评测分为物体检测和姿态估计两大任务,在目前国际上公开最大的自动驾驶场景下的视觉算法评测数据集KITTI上进行。
该工作由电子系马惠敏研究组和多伦多大学合作完成,创新性地提出了一种高效的三维物体提取方法,并结合深度卷积神经网络,依据立体图像推断场景中感兴趣目标的位置和姿态。和传统的基于昂贵的激光雷达的自动驾驶识别算法不同,该研究组的算法仅依赖于普通的双目RGB摄像头即可完成高精度的目标检测和姿态估计,因此有望大大降低自动驾驶视觉系统的成本。
评测结果见链接:http://3dimage.ee.tsinghua.edu.cn/Research