今天凌晨,小米公布了一款新的大模型,也就是大家熟知的“Hunter Alpha”,而且还把这个模型的归属权明确了。罗福莉,她是小米这个部门的负责人,说了一大堆关于这次发布的事,还提到MiMo-V2系列很快就要开源了。最近在OpenRouter上,“Hunter Alpha”这个模型挺火的,大家都在猜它是不是“DeepSeek V4”的前身。今天小米把这事儿给落实了,一下子推了三款新模型:MiMo-V2-Pro、Omni和TTS。这三款模型现在都可以免费试用到下周,只要去指定的地方就能申请。 罗福莉写了一篇文章,详细说了研发背后的故事。她强调这是小米第一款专为智能体时代打造的全栈产品系列,研发过程充满了挑战和惊喜。从聊天模式到智能代理模式的快速转变,团队经历了很多不容易的事情。她提到这个模型的基础工作其实早几个月前就开始了,目标是提升长上下文推理效率。他们用了混合注意力机制,既保证了创新又没让模型变得太大。这个模型能处理1M的上下文窗口,还用了MTP推理技术,延迟和成本都很低。 罗福莉还说了一个有趣的事情,研发的时候有一个复杂的智能体框架给团队带来了很大影响。她形容这是一个精心编排的语境,第一次体验就让她感到震惊。为了让团队接受这个框架,她甚至下了个命令:要求每个人每天必须进行100次对话。这招挺管用的,激发了大家的想象力和效率。 她还分享了一些研发经验:基础设施研究需要长期决心;训练后的敏捷性很重要;好奇心、执行力和全身心投入也很关键。最后关于开源计划她表示MiMo-V2系列在足够稳定后会进行开源。这也说明小米很重视技术共享和社区建设。