GTC2026聚焦自动驾驶发展新瓶颈:从“堆数据堆算力”转向“换大脑”与认知升级

问题——增长放缓与长尾难题并存。近年来,自动驾驶行业逐渐形成一套常见做法:扩大车队采集数据、提升车端与云端算力、叠加更复杂的软件栈,用持续迭代换取性能提升。但多家企业运营中遇到相似瓶颈:指标看起来在改善,用户体验却提升有限;在突发、罕见、非结构化交通参与者等长尾场景里——决策依然偏保守——甚至会失效。本次GTC2026对应的分享将其概括为“认知墙”——系统不缺数据,缺的是把海量数据转化为可泛化认知的能力。 原因——从“工程可加”转向“模型受限”的结构性矛盾。主要体现在三点:一是开放世界带来泛化难题。道路环境远非标准化工业场景,参与者多样且行为随机,模型如果更多依赖分布内记忆与拟合,遇到分布外事件就容易出现不稳定决策。二是数据效率偏低。车端每天产生的大量“正常驾驶片段”训练价值有限,真正高价值样本往往集中在少量复杂场景;若筛选与标注仍依赖规则和人工,就难以持续积累高质量数据。三是闭环链路过长拖慢迭代。从数据回传、筛选、训练到部署往往需要数日甚至更久,车队越大,更新延迟越明显,导致“数据越来越多、认知更新却越来越慢”。 影响——产业竞争焦点正在变化。业内普遍判断,自动驾驶正在从“系统工程问题”加速转向“模型能力问题”,直接影响主要有三上:其一,单纯增加传感器与算力的边际收益在下降,企业需要重新评估投入重点;其二,安全与体验的提升更依赖模型对交通因果关系、交互意图和风险演化的理解,验证体系需要同步升级;其三,数据治理与合规的重要性继续上升,高效闭环离不开规范的数据采集、处理、脱敏与使用机制。 对策——以“建模世界”替代“模仿轨迹”的训练思路。分享中,元戎启行介绍了400亿参数VLA模型的探索方向:把模型从单一的“动作输出器”扩展为兼具执行、分析与评估能力的系统。核心做法包括:在预训练阶段以视频预测为目标,促使模型学习运动规律、空间关系与因果线索,从“学会怎么开”进一步走向“理解为什么这样开”;在中期训练中引入“驾驶员、分析师、评估者”等多角色任务,让模型既能给出行为,也能解析场景、比较方案优劣,形成更一致的内部约束;同时通过“学习解释”等任务引入语言表达,增强推理链条与决策依据的组织能力。在推理阶段,将流程抽象为“观察—推理—执行”的连续链路,强调决策前的中间推理层,以提升复杂场景下的稳定性与可控性。 前景——从规模竞赛走向能力竞赛与安全竞赛。业内预计,下一阶段自动驾驶演进将沿三条主线推进:一是围绕高价值数据的自动化挖掘与快速闭环,形成更短周期的迭代机制;二是多模态与推理型模型能力将成为体验分化关键,竞争重点从“堆规模”转向“提效率、强泛化”;三是随着模型复杂度提升,安全验证、风险边界定义与可追溯评估将更受重视,推动测试体系从里程驱动走向场景驱动、从结果评估扩展到过程评估。

自动驾驶正处在从量变走向质变的节点。当数据积累接近上限,对驾驶本质的理解深度将成为新的竞争维度。这不仅关系到出行方式的演进,也预示着人工智能在复杂决策领域的深入突破。正如与会专家所言:“未来的智能驾驶系统,不仅要会开车,更要懂开车。”这或许意味着技术创新正在从“把车开起来”走向“把风险讲清楚、把决策做稳”。