阿里巴巴再夺世界级技术第一。
在国际最大的自动驾驶计算机视觉算法集KITTI中,阿里巴巴一举囊括三项道路场景分割任务第一,包括UMM_ROAD(多车道)、UU_ROAD(乡村车道)两项特定场景评测任务及整体场景的综合评测任务URBAN_ROAD。
KITTI数据集是国际公认的最大自动驾驶计算机算法评测数据集,由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办。
KITTI数据集最大的特点是多样性,涵盖城市、住宅区、道路、校园、行人等五大场景,采用更适合自动驾驶的BEV视角评价方式,包含众多难度较大的无标识线道路,是自动驾驶技术研发必选的调测平台。
道路场景分割在自动驾驶领域至关重要,主要应用在自动驾驶中的可行驶区域划分、自动驾驶路径规划、高精地图构建以及辅助驾驶的AR导航。
大多数自动驾驶研究机构都能做到对城市道路的大块分割,但对于边缘路面,例如路岩石、车辆沿路停靠等还存在很大识别难度。
如何把道路边缘分割的更为精细,是目前的主要攻坚方向。
阿里巴巴提供的道路场景分割示意图
机器视觉科学家任小枫带领的视觉技术团队提出基于在线难样本挖掘的网络学习方法,同时在网络中增加在线数据增强模块,及全局特征、局部特征融合机制,提升网络特征的表征能力与推广能力,解决道路分割问题中的道路边沿与车辆周围路面分割不准确、阴影干扰等问题。
最终,他们以96.06%、97.70%的分割准确率分别获得UU_ROAD(乡村车道)、UMM_ROAD(多车道)两项特定场景评测任务第一,以96.76%的准确率获整个道路场景分割综合评测任务URBAN_ROAD第一。
这也是阿里巴巴首次出现在KITTI道路场景分割的排行榜上。
据悉,阿里巴巴长期占据KITTI的车辆检测世界冠军,近日还获得行人检测项目第一。