|
|
|
|
移动端

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,有哪些亮点

一向讲究开放、不断吸吸纳新成员加入的百度 Apollo 自动驾驶平台,最近「一反常态」,主动宣布加入加州大学伯克利 DeepDrive 自动驾驶产业联盟。

作者:佚名来源:雷锋网|2018-03-11 08:14

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

一向讲究开放、不断吸吸纳新成员加入的百度 Apollo 自动驾驶平台,最近「一反常态」,主动宣布加入加州大学伯克利 DeepDrive 自动驾驶产业联盟。

美国时间 3 月 8 日,百度方面宣布 Apollo 自动驾驶开放平台正式加入 DeepDrive 深度学习自动驾驶产业联盟,并发布了 Apollo 自动驾驶数据集 ApolloScape。

如此吸引百度 Apollo 平台主动加入这个产业联盟,恐怕是后者更为丰富的自动驾驶学术成果和产业资源。

如果你对 UC Berkeley(加州大学伯克利分校)足够了解,就知道 DeepDrive 是 UC Berkeley 两大与汽车智能化相关的实验室之一(另一个是 InterACT)。

DeepDrive 的研究成果并非停留在实验室,而是与产业界结合紧密,目前合作伙伴有诸如博世、采埃孚等一级供应商,大众、本田、现代等车企,恩智浦、英伟达等芯片厂商,以及华为、驭势等中国公司均是其合作对象。

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

*Deep Drive 研究项目的合作伙伴

而 DeepDrive 深度学习自动驾驶产业联盟则是由加州大学伯克利分校领导的研究应用于汽车领域的计算机视觉和机器学习前沿技术的产业联盟。

它的成员包括:英伟达、高通、通用、福特等 20 家全球自动驾驶领域顶尖企业,研究项目覆盖感知、规划决策、深度学习等自动驾驶关键领域。

百度加入这个联盟的目的,是希望通过携手全球自动驾驶领先企业以及顶级学术研究机构,共享研究成果、加速自动驾驶的技术创新和落地应用进程,以此来壮大自动驾驶研发力量。

ApolloScape:数据量是同类数据集 10 倍以上

这次发布的另一个看点是百度开放的 ApolloScape 数据集。

数据集一般分为两类:一类是通用数据集,这是由纯计算机视觉领域提出的数据集,这类数据集仅仅因为有“车”的元素;另一类是自动驾驶数据集,不光包括计算机视觉信息,还有 IMU、GPS 等信息。例如 KITTI,这是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,地位不可小觑。

显然,百度也希望将 ApolloScape 打造成为这样一个数据集。那么,ApolloScape 数据集有哪些亮点呢?

百度认为,海量、高质的真实数据是自动驾驶开发测试中必不可缺的「原料」,因此 ApolloScape 的数据量是同类数据集(如 Cityscapes )的 10 倍以上。

其中,数据量内容包括:感知、仿真场景、路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据。百度方面介绍,从数据难度维度看,ApolloScape 数据集涵盖了更复杂的道路状况。一个例子是单张图像中多达 162 辆交通工具或 80 名行人。

除此之外,这个开放数据集采用了逐像素语义分割标注的方式,百度称这是「目前环境最复杂、标注最精准、数据量最大的自动驾驶数据集。」

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

 ApolloScape 标注数据示例

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

ApolloScape 深度数据示例

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

Kitti,CityScapes 和 ApolloScape 关于数据实例的对比

ApolloScape 另一个特点是包含了数十万帧逐像素语义分割标注的高分辨率图像数据。

为便于研究人员更好的利用数据集的价值,百度在数据集中定义了共 26 个不同语义项的数据实例(例如汽车、自行车、行人、建筑、路灯等),并将进一步涵盖更复杂的环境、天气和交通状况等。

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

数据中包含的各类实例的信息

仿真也是这个数据集的一个重点项目。百度的目标是打造真实世界还原度最高、场景最丰富的仿真平台。

据雷锋网了解,基于 Apollo 仿真平台,ApolloScape 计划将数十辆自动驾驶车辆投入到同一个路网中行驶,通过模拟真实复杂驾驶场景和多车博弈过程,帮助研发人员有效检验并优化预测、决策和路径规划等算法,提升自动驾驶测试的多样性。

百度发布了一个“超同类 10 倍”数据量的自动驾驶数据集,看看它有哪些亮点

为了盘活这个数据集,吸引更多开发者使用 ApolloScape 数据集,在今年的 CVPR 期间,百度 Apollo 将联合加州大学伯克利分校举办自动驾驶研讨会(Workshop on Autonomous Driving),希望借此为全球自动驾驶开发者和研究人员提供一个技术突破和应用创新平台。

「大系统」与「小模块」

在过去,计算机视觉一直面临的一个通病是旧的算法在新的数据集上不起作用。

「我们号称解决了一个问题,只不过是解决了一个数据集,并不能说明我们真正解决了这个问题,而这种情况经常发生。」国内某家自动驾驶公司 CTO 对雷锋网(公众号:雷锋网)表示。

举例而言,我们可以将自动驾驶这个「大系统」拆成 100 个小的计算机视觉问题。

但这里就存在值得深思的两点:第一,我们不知道这 100 个问题中哪个问题更重要;第二,我们不知道在解决了哪个问题、解决到何种程度以后,就能号称我们完全解决了自动驾驶问题。

所以,如何解决自动驾驶「大系统」和自动驾驶「小模块」之间的问题,这才是百度 ApolloScape 数据集需要建立的下一步优势,也是从业者和开发者们需要的自动驾驶数据集。

【编辑推荐】

  1. 百度上线“逆天”新工具Visual DL 可适用于各大深度学习框架
  2. 转眼人到中年:前端老程序员无法忘怀的一次百度电话面试
  3. 重磅!谷歌突然宣布!百度、滴滴懵了
  4. 会员内容免费看:百度携多家音、视频平台推“全民VIP狂欢节”
  5. 百度员工晒“职业装备”:大开眼界
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月最赞

读 书 +更多

网管员必读——网络组建

本书以一个模拟局域网组建为思路,介绍了与局域网组建各主要方面相关的知识及组建、配置方法。本书所介绍的内容主要包括:局域网组建规划、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊