得益于深度学习和人工智能领域的突破,自动驾驶技术取得了越来越快的进步,Robotaxi、干线物流、无人配送车、无人环卫、无人巴士、无人泊车等智驾场景落地逐渐深入,发展一片向好。但目前自动驾驶汽车想要实现实际道路行驶,还有众多需要解决的技术问题。
自动驾驶需要解决“感知”和“决策”两个方面的问题。感知是使用多种融合的传感器,通常包括摄像头、激光雷达、毫米波雷达、GPS/IMU等设备来感知路面、车辆和行人;决策则是使用感知到的信息来判断应该如何行动。所以有效的感知将是作出可靠决策的前提。
简单来说,自动驾驶系统根据从感知融合模块得到的环境信息,如其他车辆、红绿灯、行人等数据反馈,才可做出具体行为决策,如刹车、变道、超车等等。
而当前解决感知问题的主要方式就是“数据训练”,通过监督学习的方法将大量各种情况的训练数据提供给算法,让生成的模型具备普适的感知能力。基于自动驾驶落地需求对海量原始数据进行框选、提取、分类等一系列处理,将混杂数据转化为机器学习可识别的智能驾驶专业数据,帮助驾驶技术更好的感知实际道路、车辆位置和障碍物信息、疲劳检测等,实时感知在途风险,实现智能行车、自动泊车等预定目标。
智能驾驶时代的关键——背后的高质量数据
对于自动驾驶汽车来说,想要在瞬息万变的复杂真实驾驶场景中发挥感知作用,背后就需要有海量道路场景的数据通过专业人员进行标注,从而转化为算法训练的数据支撑。这使得数据标注工作成为一项十分重要且有价值的工作。
前几日,以高质量、场景化服务著称的AI训练数据商云测数据在2021世界人工智能大会上重磅发布了新一代自动驾驶数据解决方案,面向自动驾驶项目研发初期到落地过程,提供场景数据库、定制化数据采集标注、数据标注&数据管理平台等一站式数据服务,助力自动驾驶技术感知层面的快速落地。
据了解,云测数据的新一代智能驾驶数据解决方案在为智能驾驶相关企业提供大规模感知数据能力的同时,可减少数据采集周期、提升数据标注效率,并大幅降低AI模型训练成本,极大地加速智能驾驶相关应用的落地迭代周期,节省大量研发时间和成本。
这一解决方案对驾驶领域,特别是在加速自动驾驶产业场景化、安全落地、用户体检提升、安全行驶等落地等方面具有积极意义。
那么,新一代自动驾驶数据解决方案具备哪些特点和优势呢?
首先,这一方案具有丰富的自动驾驶场景基础数据库。基于智能驾舱和车外环境感知落地发展需求,云测数据按主流传感器型号建立了智能驾驶场景数据库,包含多场景、多天气状况、多环境状况,涵盖了覆盖活体验证、手势识别、视线追踪、动作识别等多场景。
其次,具有更高质量的驾驶场景数据采集标注服务。云测数据自主研发数据标注平台,平台功能强大,覆盖所有自动驾驶所需要的2D/3D等不同类型的标注工具,可满足各种数据标注需求且配置灵活,累计在智能驾驶领域标注2D/3D数据已达数亿帧,最高数据标注准确率可达99.99%,这一纪录也使云测数据成为国内最高标注精度记录保持者。
云测数据还坚持自建数据标注基地,标注员、质检员、项目经理统一管理、规范生产,且制定了一套包含任务分配、需求分析、需求确认、数据清洗、试标确认、进度控制、质量保障等完整的作业流程体系在保证数据准确率的同时有效保证标注作业的信息流转,提升标注效率。全方位数据安全与隐私保障能力,多重措施满足企业对于数据安全的诉求,帮助企业构建核心数据壁垒。
第三,云测数据建有先进的数据标注平台&数据管理平台。云测数据标注平台拥有业内全面且强大的标注工具,支持功能定制,支持与各类系统对接,可灵活配置。支持私有化部署在企业本地,智驾企业可在内网组织员工进行数据标注工作。
在自动驾驶AI数据标注过程中,面临“种类繁多、时间效率、数据质量”等众多难题。云测数据标注平台可完美解决AI落地场景多样性、丰富性的数据需求。 并通过标注平台将全流程优化,可助力AI数据训练过程综合效率提升200%,标注流程质量把控,数据标注最高精度99.99% 。
在自动驾驶AI数据训练过程中,数据管理也面临巨大挑战,如数据资产、管理方式、版本管理等等。云测数据标注平台支持多维度灵活数据检索,可视化数据管理,助推AI数据产能升级。可实现资产权限管理、标签化检索、标签结果可视化、标注数据版本管理等功能。
目前,云测数据已与业内包括自主、合资车企,大型Tier1、Tier2,无人出租车等自动驾驶相关等众多企业,建立了持久良好的合作关系。
高精度的训练数据更受关注
从1886年的卡尔·弗里德里希·本茨发明出汽车开始,拓宽了人们的出行半径,加速了人流与物流的流动速度。到1939年,第一款配备自动变速器的汽车问世,解放了驾驶员的右手(左舵驾驶,右舵驾驶则解放左手);再到世纪交替时,ACC自适应巡航解放了驾驶员的双脚。而现在的智能驾驶技术问世,科幻电影中的自动驾驶离我们的距离正在快速接近。
在AI时代,真正的智能驾驶汽车应该是什么样的?中国工程院院士、中国人工智能学会理事长李德毅给出了答案:“必须像人一样具备学习能力,能处理各种工况。”要得到这样的结果,需要让汽车自身的算法能做到处理更多、更复杂的场景,而这就需要有海量、准确、高质的场景数据,进而对其进行标注。
作为AI技术的底层支撑,高质量的训练数据越来越受到业界的重视,成为智能驾驶真正落地的“幕后英雄”。可以说,自动驾驶真正商业化落地的关键之一,就是要通过人工智能算法处理更多更复杂的场景。
从宏观角度来看,现有算法、算力无法准确处理复杂交通环境下无限可能的长尾场景,这时候高质量AI数据的覆盖就显得更加重要,具象到自动驾驶落地需求来看,高质量的场景数据也已成为各方业务领先竞争的关键。