当前位置: 网站首页 技术文章 正文

任少卿谈世界模型:开启自动驾驶和机器人新纪元

来源:互联网 发布时间:2024-09-24 14:52:36

与任少卿的交流,始于一个日常却颇具挑战性的场景——智能车辆如何在特定时间段内遵守公交车道的使用规定。

任少卿谈世界模型:开启自动驾驶和机器人新纪元

在过去,人工智能系统遵循着预先编写的规则行事,但在如今端到端的自动驾驶模式下,固定的规则正在被淘汰,取而代之的是AI需要自主学习适应各种交通状况,这一转变既带来了进步也带来了挑战。

因此,是否可以说智能汽车行业内外对于“端到端”自动驾驶存在一定的盲目信任?

作为一项综合性技术,自动驾驶为何需要端到端?

端到端模式为何在此时兴起?其本质是什么?

它将对智能汽车的研发及行业变革产生何种影响?

对于这些问题,作为世界级AI科学家、ResNet联合发明者,并且是蔚来智能驾驶部门的领导者,任少卿无疑是最具权威的解答者。

任少卿认为,端到端的发展趋势是一种必然,就像汽车制造逐渐趋向集成化生产一样,尽管存在技术难题,但并不存在独门绝技。

在他的观点中,无论是AI还是自动驾驶,近几年虽有所变化,但其核心并未改变。下面是他对几个关键问题的看法:

探讨端到端

量子位:端到端如何识别公交车道,并根据时间调整行为?

任少卿:实现这一点的方法多种多样,若需准确识别,则可能还需学习如何辨认文字。

量子位:目前尚无法实现?

任少卿:当前系统主要依赖历史经验,但由于这些经验中包含大量噪音,使得精确识别变得困难。

所谓噪音,是指系统在缺乏明确指示时的行为偏差。例如,当看到其他车辆驶入公交车道时,系统可能会跟随进入;反之则不会。然而,依据交通规则,不应随意进入公交车道,这便是噪音。

因此,如何精准识别,是亟待解决的问题。

量子位:近年来,端到端成为了行业热点,众多企业纷纷投入。

为什么不直接编写规则来解决公交车道的问题,反而要摒弃手写规则?

任少卿:考虑到不同城市的公交车道规则差异巨大,且随时可能变动,为每个场景编写规则显然是不切实际的。

在过去,当应用场景相对简单时,例如高速公路上的导航辅助,编写规则是可行的。然而,随着城市道路领航辅助及主动安全功能的出现,面对更为复杂的环境,传统的编写规则方法已难以胜任。

跳出自动驾驶领域,端到端技术的应用还在于追求统一性。而在自动驾驶领域,这一技术的发展是为了解决日益复杂的场景需求,提高系统应对全面复杂场景的能力。

此外,端到端技术还反映了AI发展的两大趋势:性能提升和泛化能力增强。

量子位:所以Transformer不仅提升了算法效能,还促进了泛化能力的发展?

任少卿:Transformer是一个重要工具,但更深层次的目标是追求更好的效果和更广泛的适用性。

量子位:用户似乎越来越关心智能驾驶是否采用了端到端系统。但实际上,这对于他们来说可能并不重要,只要车辆表现良好即可。

任少卿:用户对此的关注反映出他们对技术细节的兴趣,这本身是件好事。

任少卿谈世界模型:开启自动驾驶和机器人新纪元

量子位:端到端将如何改变你们的研发流程?

任少卿:实际上,深度学习在自动驾驶中的应用早已开始,只是近期关注度上升,使人们更加关注这一过程。

量子位:自动驾驶是否会遇到类似于“9.11”与“9.9”大小判断失误的问题?

任少卿:确实存在类似问题,这在自动驾驶中表现为Corner cases,即误检或漏检。解决这类问题通常涉及时序分割和校验机制。

量子位:视频数据包括真实标注数据和由世界模型生成的数据,这与语言模型中的合成数据类似。

任少卿:任务的通用性决定了其价值。从视觉角度看,定义一个更基础的任务有助于解决更广泛的问题。

量子位:视频生成视频是否是对问题的一种穷举?

任少卿:是的,从本质上讲,视频生成视频涵盖了所有可能性,是更根本的任务。

量子位:现今的世界模型与以往的虚拟仿真有何区别?

任少卿:虚拟仿真侧重于再造视觉世界,而世界模型旨在全面理解现实世界。

量子位:蔚来在介绍世界模型时提到类似人脑的两部分划分,这是出于简化理解的目的还是系统本身的特性?

任少卿:这种划分是为了便于理解,实际上系统内部是相互耦合的。

量子位:对于生成式AI,你有何看法?

任少卿:生成式AI正在发生显著变化,尤其是在自动驾驶与机器人融合方面,世界模型提供了接近通用的解决方案。

量子位:构建世界模型过程中会面临哪些工程问题?

任少卿:面临诸多挑战,但世界模型正成为未来机器人、自动驾驶和语言模型的基础框架。

量子位:世界模型的多元自回归生成结构是什么?

任少卿:该结构包括生成、自回归和多元三项特征,旨在解决多数据源问题,实现跨领域融合。

量子位:城区NOA体验差异的因素有哪些?

任少卿:主要由模型、数据、优化机制和功能多样性四个方面决定。

量子位:如何看待自动驾驶与机器人的未来发展?

任少卿:自动驾驶和机器人技术正趋于融合,目标是打造具备广泛适应性的智能体。

量子位:你如何看待近年来产业的变化?

任少卿:近年来自动驾驶领域发生了显著变化,这些变化很大程度上源于AI在其他领域的进展。

量子位:是否预示着未来将朝着通用模型的方向发展?

任少卿:的确如此,但关键是如何实现这一目标。随着AI与机器人技术的交叉融合,智能驾驶的发展也将受益于此。

相关教程