小米发布全模态基座模型MiMo-V2-Omni并开放接口 加码智能体强化“人车家”协同

人工智能技术快速演进的背景下,小米近日发布新一代全模态基座模型MiMo-V2-Omni,意味着其智能化生态布局加快。该模型具备跨模态感知能力,并将图形用户界面(GUI)操作能力纳入统一框架,可直接接入各类智能体框架。内部测试数据显示,其表现已接近,部分指标甚至超过一些行业领先的闭源模型。 技术突破背后,是研发流程的高效推进。项目负责人介绍,团队在开发中设置了更严格的考核与节点要求,成员需在限定时间内完成大量测试任务,以加快性能迭代。高强度的节奏提升了研发效率,也为技术落地争取了时间。 商业化上,小米的路径较为明确。除向开发者开放API接口外,MiMo-V2-Omni已与金山办公展开合作,重点探索文本生成与结构化数据处理等场景。此外,小米计划将其深度整合至澎湃操作系统,以实现跨设备语音指令理解、自主调用应用以及车机界面控制等能力。若落地顺利,有望提升小米硬件生态的协同效率与整体价值。 然而,压力同样存在。当前小米面临智能手机业务毛利率承压、汽车业务投入高企的双重挑战。与聚焦云计算与人工智能的互联网巨头相比,小米在资金储备与算力基础设施上仍有差距。如何在资源约束下平衡手机、汽车与大模型三条主线的投入,成为管理层需要回答的关键问题。 对此,小米创始人雷军表示,公司在人工智能领域的进展超出外界预期,并称今年研发投入将突破160亿元,发出继续加码技术投入的信号。

基础模型发布只是开始,真正的竞争在于能否把技术融入操作系统、供应链与服务体系,让智能化从“能演示”走向“可规模化、可持续”;在硬件行业进入存量竞争、汽车与家居加速智能化的当下,谁能以更低成本把跨设备协同与任务执行做深做透,谁就更可能在下一阶段生态竞争中占据主动。小米此次押注,考验的不只是模型迭代速度,更是系统整合能力与长期投入的耐力。