小米集团旗下MiMo API平台近日宣布正式开放充值功能,标志着其大模型商业化服务进入新阶段。
该平台将于近期上线完整的计费系统,为开发者和企业用户提供规范化的付费服务。
从定价策略看,小米MiMo API平台展现出明显的成本竞争优势。
国内市场方面,MiMo-V2-Flash模型的输入价格为0.7元每百万tokens,命中缓存时可降至0.07元每百万tokens,输出价格为2.1元每百万tokens。
海外市场定价同样具有吸引力,输入价格为0.1美元每百万tokens,缓存命中价格为0.01美元每百万tokens,输出价格为0.3美元每百万tokens。
这一定价体系相比业界主流产品具有显著的价格优势,特别是在缓存命中场景下,成本优化空间更为突出。
为降低用户使用门槛,小米官方为新老用户准备了专属免费额度支持。
新用户可领取20元赠送余额,用于体验平台服务。
这一举措旨在吸引更多开发者参与生态建设,加速应用创新。
在支付方式上,平台充分考虑了不同用户群体的需求。
国内用户可选择小米支付、支付宝、微信支付三种主流充值渠道,但需要先完成个人实名认证,企业认证功能暂未上线。
海外用户则可直接充值,支持Apple Pay、Google Pay、信用卡和借记卡等国际通用支付方式,使用流程更加便捷。
MiMo-V2-Flash模型本身具有突出的技术特性。
该模型采用混合专家(MoE)架构,总参数量达309亿,其中活跃参数量为15亿,通过Hybrid注意力架构创新和多层MTP推理加速技术,实现了极致的推理效率。
在多个Agent评测基准上,该模型已进入全球开源模型前两名行列。
从性能对标看,MiMo-V2-Flash在代码能力方面超越所有开源模型,与业界标杆闭源模型Claude 4.5 Sonnet相当,但推理成本仅为其2.5%,生成速度提升2倍。
这一成本效益比优势使其特别适合对成本敏感的应用场景,包括智能客服、内容生成、代码辅助等领域。
模型专为智能体AI应用设计,强调快速推理和高效执行,满足实时交互类应用的需求。
小米此举反映了国内大模型厂商在商业化道路上的积极探索。
通过开放API平台、制定竞争性定价、提供免费试用等措施,小米正在构建完整的大模型应用生态。
这种商业模式有利于降低中小企业和开发者的AI应用成本,加速人工智能技术在各行业的渗透和应用。
从行业发展趋势看,大模型API服务的价格竞争日趋激烈,这对整个产业具有积极意义。
价格下降有助于扩大应用覆盖面,促进更多创新应用涌现,同时也推动大模型厂商在技术效率和成本控制方面的持续优化。
大模型服务正在从“展示能力”走向“交付能力”。
充值、计费、合规与工程化优化看似是平台运营的基础工作,却决定了技术能否真正进入产业链条、形成可持续的应用创新。
对企业与开发者而言,理性评估成本结构与服务稳定性、把工程优化纳入产品设计,将比追逐单一指标更重要;对平台而言,唯有以透明、可靠、可治理的方式提供算力与模型服务,才能在新一轮数字化应用浪潮中赢得长跑优势。