小米汽车发布新一代自动驾驶技术 破解算力瓶颈实现认知驱动突破

问题:量产辅助驾驶面临“感知更强、算力更紧”的现实矛盾 当前行业加速迈向城市复杂场景的高阶辅助驾驶,但量产车端必须有限算力与功耗条件下实现毫秒级响应;陈光在会上表示,车辆需要实时处理多路高清摄像头数据以及激光雷达等传感器信息——数据流密度高、时延要求严——而主流量产平台可用算力通常在700—1000TOPS区间。算力一旦被过度占用,不仅会抬升延迟,还可能触发系统降级、体验波动等问题,进而影响规模化交付的稳定性与安全边界。 原因:从“堆模型”到“可交付”,工程约束倒逼技术路线重构 行业曾一度把能力提升寄托于更大规模的端到端网络,但在车端直接承载长链路推理,往往会遭遇算力过载、温控压力和部署复杂度上升。陈光指出,小米团队的判断是:量产阶段要优先满足确定性时延与可维护性,不追求“模型上车即最强”,而是把云端的知识表达转化为车端可吸收的先验,让车端模型在更轻量的前提下获得更强的环境理解与决策约束能力。 这个思路也来自对行业共性问题的反思:数据驱动容易形成“走捷径”的行为,端到端方案也可能受偶然对应的性影响;仅靠扩大训练数据与参数规模,难以在长尾场景中持续稳定。 影响:认知能力下沉有望提升稳定性,但也对验证体系提出更高要求 从技术演进看,小米披露其辅助驾驶经历多代迭代:2024年初以规则架构落地高速NOA;随后在2024年11月推进数据驱动的端到端方案量产;并在2025年11月继续引入世界模型与强化学习思路,加强复杂交通环境下的策略评估与动作选择。陈光认为,通过引入“认知先验、持久化记忆、世界模型、强化学习”等模块化能力,端到端控制可以保留更连续、更拟人化的操控感,同时把常识与物理逻辑更明确地融入决策,降低误判、无效制动等问题的发生概率。 但业内人士也指出,认知与生成式能力一旦进入决策链路,对测试覆盖度、可解释性与一致性提出更高要求。如何在不同城市道路结构、交通参与者行为差异下保持稳定输出,仍需要长期数据闭环与严格验证体系支撑。 对策:“云端赋能、车端执行”与动态感知策略提升算力利用效率 据介绍,小米的关键路径是将云端多模型形成的知识压缩为车端可用的“认知先验”,并通过工程化手段控制车端推理的算力与时延开销。 其一是认知先验蒸馏:在云端用多组视觉基础模型形成“教师体系”,向车端轻量“学生模型”传递稠密特征、概念边界与时空占据等信息,使车端在较小模型体量下获得更强的环境表征能力。 其二是引入面向未来可行驶空间的占据表达,强化对物理约束与交通因果的学习,用以减少端到端模型因数据偏差产生的“捷径行为”。陈光举例称,部分场景下模型可能因旁车道车辆停车而误触发制动;融入未来可行驶空间的先验后,系统更倾向于依据自车前方空间是否畅通作出判断,减少不必要的干预。 其三是在感知侧提出分层动态策略,通过“核心决策视野、侧向机动视野、环境语境视野”的差异化频率与分辨率配置,在像素预算内优先保障关键区域信息:核心视野保持高频高分辨率,侧向视野在变道、路口等场景动态提升,语境视野以较低频率提供补充。该思路强调更精细的调度,用更低成本获得更高的有效信息密度,为量产平台保留冗余空间。 此外,陈光还提到,通过时序融合与记忆压缩等方法构建“持久化记忆”,让系统对交通参与者状态与道路结构形成更稳定的跨帧理解;并以世界模型进行状态预测与策略价值评估,再结合强化学习提升复杂互动场景下的动作质量与鲁棒性。整体框架意在把原本更多运行在云端的能力,以可部署、可维护的方式迁移到量产车端。 前景:认知驱动或成产业转向重点,规模化落地仍需安全与标准并进 从产业趋势看,规则驱动强调可控但扩展性有限,纯数据驱动提升了泛化能力却更易受长尾与偏差影响。陈光的分享反映出一种可能路径:在端到端连续控制的基础上,引入可验证的先验约束与可预测的世界表征,以更工程化的方式逼近“懂规则、懂物理、会决策”的能力组合。若该路线在量产规模上验证有效,有望在不明显增加车端硬件成本的前提下,提升城市复杂场景中高阶辅助驾驶的稳定性与一致性,推动体验从“能用”走向“好用、敢用”。 另外,行业下一阶段的竞争可能更多聚焦三上:一是云端与车端协同效率,即如何在不同地区、不同车型上快速复用与迭代;二是安全与合规体系建设,包括极端场景覆盖、功能边界提示与数据闭环治理;三是开放道路条件下的可迁移能力与持续交付能力。只有技术、工程、验证与法规合力推进,认知驱动方案才能真正转化为可规模交付的产品能力。

智能驾驶从实验室走向大规模上路,决定成败的不只是模型规模与数据体量,更在于对量产约束的充分理解和对工程细节的扎实把控。以“云端形成认知、车端高效执行”为代表的思路,显示行业正在从参数竞赛转向体系能力竞赛。可持续的技术进步,应让安全更可靠、体验更稳定、成本更可控同时成为现实,这也将是智能驾驶走向更广泛应用必须交出的答卷。