GTC2026聚焦自动驾驶发展新瓶颈：从“堆数据堆算力”转向“换大脑”与认知升级

问题——增长放缓与长尾难题并存。近年来，自动驾驶行业逐渐形成一套常见做法：扩大车队采集数据、提升车端与云端算力、叠加更复杂的软件栈，用持续迭代换取性能提升。但多家企业运营中遇到相似瓶颈：指标看起来在改善，用户体验却提升有限；在突发、罕见、非结构化交通参与者等长尾场景里——决策依然偏保守——甚至会失效。本次GTC2026对应的分享将其概括为“认知墙”——系统不缺数据，缺的是把海量数据转化为可泛化认知的能力。原因——从“工程可加”转向“模型受限”的结构性矛盾。主要体现在三点：一是开放世界带来泛化难题。道路环境远非标准化工业场景，参与者多样且行为随机，模型如果更多依赖分布内记忆与拟合，遇到分布外事件就容易出现不稳定决策。二是数据效率偏低。车端每天产生的大量“正常驾驶片段”训练价值有限，真正高价值样本往往集中在少量复杂场景；若筛选与标注仍依赖规则和人工，就难以持续积累高质量数据。三是闭环链路过长拖慢迭代。从数据回传、筛选、训练到部署往往需要数日甚至更久，车队越大，更新延迟越明显，导致“数据越来越多、认知更新却越来越慢”。影响——产业竞争焦点正在变化。业内普遍判断，自动驾驶正在从“系统工程问题”加速转向“模型能力问题”，直接影响主要有三上：其一，单纯增加传感器与算力的边际收益在下降，企业需要重新评估投入重点；其二，安全与体验的提升更依赖模型对交通因果关系、交互意图和风险演化的理解，验证体系需要同步升级；其三，数据治理与合规的重要性继续上升，高效闭环离不开规范的数据采集、处理、脱敏与使用机制。对策——以“建模世界”替代“模仿轨迹”的训练思路。分享中，元戎启行介绍了400亿参数VLA模型的探索方向：把模型从单一的“动作输出器”扩展为兼具执行、分析与评估能力的系统。核心做法包括：在预训练阶段以视频预测为目标，促使模型学习运动规律、空间关系与因果线索，从“学会怎么开”进一步走向“理解为什么这样开”；在中期训练中引入“驾驶员、分析师、评估者”等多角色任务，让模型既能给出行为，也能解析场景、比较方案优劣，形成更一致的内部约束；同时通过“学习解释”等任务引入语言表达，增强推理链条与决策依据的组织能力。在推理阶段，将流程抽象为“观察—推理—执行”的连续链路，强调决策前的中间推理层，以提升复杂场景下的稳定性与可控性。前景——从规模竞赛走向能力竞赛与安全竞赛。业内预计，下一阶段自动驾驶演进将沿三条主线推进：一是围绕高价值数据的自动化挖掘与快速闭环，形成更短周期的迭代机制；二是多模态与推理型模型能力将成为体验分化关键，竞争重点从“堆规模”转向“提效率、强泛化”；三是随着模型复杂度提升，安全验证、风险边界定义与可追溯评估将更受重视，推动测试体系从里程驱动走向场景驱动、从结果评估扩展到过程评估。

自动驾驶正处在从量变走向质变的节点。当数据积累接近上限，对驾驶本质的理解深度将成为新的竞争维度。这不仅关系到出行方式的演进，也预示着人工智能在复杂决策领域的深入突破。正如与会专家所言：“未来的智能驾驶系统，不仅要会开车，更要懂开车。”这或许意味着技术创新正在从“把车开起来”走向“把风险讲清楚、把决策做稳”。