(问题)自动驾驶能否安全、稳定地走进日常出行,仍是公众最关注的话题之一;业内调研显示,超过六成车主对涉及的功能保持观望,担忧主要集中“关键场景是否可靠”“复杂环境会不会误判”“极端天气是否失效”等。随着城市道路开放测试推进、辅助驾驶功能普及,技术能力与用户信任之间的差距,正成为产业继续向前的实际门槛。 (原因)李想指出,目前不少方案主要基于2D视觉数据进行训练与推理,容易在三维几何结构、遮挡关系和距离尺度等关键信息上出现缺失。他将其概括为:系统在“看见”与“理解”之间仍有断层。业内常用的BEV(鸟瞰)表征便于规划与融合,但从二维到三维的映射不可避免带来维度压缩;OCC(占用网络)更强调几何占据状态,对道路语义、交通参与者意图等更“可解释”的信息表达仍偏弱。在他看来,人类驾驶能力依赖对三维物理空间的长期建模与经验归纳;如果模型训练难以在三维空间内形成一致认知,就容易在施工路段、异形车道、汇入汇出等非典型场景暴露边界问题。 (影响)这些短板直接影响自动驾驶系统的安全冗余与推广能力。一上,感知不稳定会放大决策风险,使制动、变道、让行等动作出现犹豫或过度保守;另一方面,过度依赖单一传感器或特定数据分布,也会提高系统在雨雾夜间、逆光炫目等条件下的失效概率。对车企而言,这不仅是体验问题,还涉及合规测试、事故责任与品牌信任,影响技术从“能用”走向“可规模化使用”的节奏。 (对策)针对行业普遍的二维训练路径,理想提出原生3D视觉编码器与三维空间训练方案。据介绍,该方案将模型学习与推理直接放在三维空间中完成,并以更高算力支撑更大规模的三维特征计算与多模态融合。理想称,自研“马赫”芯片带来约三倍算力提升,使系统在500米以上距离实现更稳定的环境感知;激光雷达在该体系中更多承担高精度标定与校验角色,用于增强整体冗余与一致性。相关技术文档披露,动态障碍物轨迹预测准确率提升约42%,复杂路口决策延迟可降至90毫秒以内;在夜间雨雾等极端天气测试中,有效感知率仍可保持在98.7%左右。业内人士指出,若上述指标能在更大规模、更多城市道路和更长周期内持续验证,将有助于缓解用户对“关键时刻靠不靠得住”的核心担忧。 (前景)从产业趋势看,自动驾驶竞争正从“堆传感器、拼数据”转向“重认知、重通用”。李想同时透露,公司正探索基于该架构的通用平台能力,尝试向家庭服务、工业自动化等更广泛的物理场景延伸。业内认为,若三维感知与更强的场景推演能力能够沉淀为可复用底座,有望提升跨场景迁移效率,推动技术从“单一交通功能”走向“通用物理智能体”。但也需要看到,任何路线要实现大规模商用,仍需经受法规边界、公开道路验证、极端场景覆盖、数据合规与安全评测体系等多重考验,尤其要在可解释性、失效监测与人机共驾策略上形成更严格的工程闭环。
自动驾驶的突破不仅会改变出行方式,也是在推动人工智能更深入地理解物理世界;理想汽车提出的三维视觉方案为缓解行业瓶颈提供了新思路,其意义或在于深入打开“机器如何认知现实”的技术路径。当智能系统能够更接近人类对三维空间与物理规律的理解,我们或将看到人工智能与物理世界更紧密的融合。