你知道吗,最近小米发布了三款大模型,全都是给Agent时代准备的,看得我眼睛都亮了。3月19日这天,小米正式搞了个发布会,一口气推出了旗舰基座MiMo-V2-Pro、全模态的MiMo-V2-Omni和语音合成的MiMo-V2-TTS,把自家的AI能力给全面升级了。我先跟你说说那个最厉害的旗舰基座,它的总参数达到了惊人的1T,还能处理长达1M的超长上下文。这就好比给AI准备了一个超级大脑,专门用来对付高强度的任务。你说它有多牛?在国际权威榜单Artificial Analysis上直接排到了第八,国内排名更是第二。我试着跟它聊了几句,感觉就像Claude Sonnet 4.6一样顺滑,甚至还能稍微跟Opus 4.6打个平手。最让人惊喜的是它的价格,只要后者的1/5就搞定了。这款模型早就被塞进了WPS、小米浏览器还有手机里的智能体“miclaw”里,还联合了很多开发框架搞免费体验活动。 除了这个,还有全模态模型MiMo-V2-Omni也挺有意思。它把文本、视觉和语音这几个通道打通了,能理解你说的话、看懂图、还会说话,真正做到了跨模态的理解和操作。之前我在OpenRouter上看到一个叫“匿名测试版本Healer Alpha”的东西,在那边的调用量直接冲到了前列。后来我在OpenClaw测评榜单上又看了一眼,它的平均分居然拿了第一!这技术水平绝对是国际顶尖的。 最后就是那个能让声音更带感的MiMo-V2-TTS了。它用了小米自己研发的Audio Tokenizer和多码本联合建模的架构,经过了海量的语音数据训练还有多轮强化学习。现在它不光能调整整体风格,就连局部的情绪变化都能精准控制。想跟你用方言聊天?没问题!想让它扮演某个角色或者直接唱歌?也行!这个模型的目的就是给智能体配上一个温暖又有情感的“嘴巴”,让咱们跟AI打交道的时候不再冷冰冰。 现在这三个大家伙都已经开放API服务了,而且已经在小米自家的APP还有金山办公的产品里用上了。以后咱们打开手机APP,就能享受到更智能、更有人情味的交互体验了!