北京大学-百度“基于单帧图像的三维车辆位姿估计”Kaggle竞赛圆满收官-新闻动态-北京大学前沿计算研究中心

新闻动态

北京大学-百度“基于单帧图像的三维车辆位姿估计”Kaggle竞赛圆满收官

时间 : 2020-03-19 来源 : 陈宝权课题组作者 : VCL

　　近日，由北京大学前沿计算研究中心与百度研究院机器人与自动驾驶实验室在国际数据建模和数据分析竞赛平台 Kaggle 共同举办的 “基于单帧图像的三维车辆位姿估计（Peking University/Baidu - Autonomous Driving）”挑战赛圆满收官。

　　竞赛网站：https://www.kaggle.com/c/pku-autonomous-driving

　　本次竞赛总奖金25000美元，共吸引了超过866支队伍、1100余名成员参与，总提交数超过10000次，来自全球62个国家。值得一提的是，有247名参赛者是第一次参与Kaggle竞赛，他们取得的成绩优异，其中6名成员进入榜单前10名。

　　本次竞赛的主题为“基于单帧图像的三维车辆位姿估计”，该主题紧密结合当前最流行的自动驾驶场景，同时兼顾到了考题的难度和工业的实用性。基于单帧图像的三维物体位姿估计一直是计算机视觉领域的一个热点与难点，该问题的解决可以很大程度上降低自动驾驶传感器的价格，从而推动自动驾驶行业的商业化进程。联合承办方北大和百度的密切合作，促进了科研机构与企业的优势互补，加速了这一进程。

　　本次竞赛的数据主要来自百度自动驾驶大型开源数据集 ApolloScape 的 3D Car Instance 子数据，该数据集及相关研究在计算机视觉顶级会议 CVPR2019[1] 上发表之后，收获了巨大关注，成为自动驾驶领域研究的重要基准数据集。本次挑战赛使用了5324帧图像，每帧图像中的车辆都提供了精准的位置标注以及相应的三维车辆模型。其中的4283帧标注图像用作训练，其余1041帧图像用于测试。

　　本次竞赛前三名的队伍 outrunner、PAPCIC 和 bestfitting 共同分享了2.5万美元的奖金。其中，第一名队伍的算法在测试集进行评价达到了0.148分值，其核心方案由 hourglass centernet 网络构成，结合翻转、旋转、增加噪声和模糊、颜色变化等手段进行数据增强，网络的6DoF输出采用更直观的 [yaw,pitch,roll,x,y,z,r] 变量表示，以及进行了后处理对回归的位姿进行优化。

　　未来，北京大学前沿计算研究中心将与百度研究院机器人与自动驾驶实验室在自动驾驶领域的三维物体姿态估计等方面继续展开合作。

引用：

[1] Xibin Song, Peng Wang, Dingfu Zhou, Rui Zhu, Chenye Guan, Yuchao Dai, Hao Su, Hongdong Li, and Ruigang Yang. Apollocar3d: A large 3d car instance understanding benchmark for autonomous driving. In IEEE CVPR 2019.

延伸阅读

　　北京大学前沿计算研究中心成立于2017年12月，为北京大学新体制科研机构，立足国际计算机学科前沿，与世界顶尖高校及科研机构深度合作，在计算理论、人工智能，以及计算与经济、生命科学、医疗健康等多个领域的交叉方向展开前沿探索，创立具有国际一流影响力的计算理论科学研究中心；形成跨领域、交叉融合的应用支撑中心。中心创建宽松自由的国际化学术环境，助力青年科学家成长为计算机学科世界一流的学者；并以“图灵人才培养计划”为代表，建立国际先进的计算科学及相关交叉学科人才培养机制，为国家新时代科技和教育发展培养引领未来的卓越人才。

　　北京大学可视计算与学习实验室隶属北京大学前沿计算研究中心，在陈宝权教授带领下，围绕图形学、三维视觉、可视化及机器人等领域展开科学研究，坚持跨学科前沿技术探索、视觉艺术和技术融合两条主线，长期与顶级国际团队深度合作，并积极进行产业化实践与推广。

　　百度机器人与自动驾驶实验室成立于2018年1月，是百度研究院旗下的一个科研机构。实验室重点关注机器人与自动驾驶实验室重点关注机器人技术，尤其是在自动驾驶领域夯实百度无人驾驶基础技术。

　　Kaggle是世界最大的开放式在线数据分析和预测挑战平台，成立于2010年，目前隶属于谷歌。平台上有超过7万多数据科学家活跃于各类机器学习导向的研究和应用问题，参与者既可以通过向专家学习和交流来提升自身能力，同时也有机会通过参与竞赛来获得一定奖励。Kaggle 平台为需求方和技术提供方创造了透明可靠的交流界面，平台的高知名度吸引了许多大型公司和机构，从实际应用角度提供一些数据和急需解决的问题，并且提供丰厚的奖励，以此来收集大量解决方案，促进技术发展和社区建设。