(问题)随着大模型应用从文本对话延伸到“内容生产工具链”,开发者与企业客户的需求出现明显变化:一方面,代码生成、数据处理等传统编程需求仍增长;另一上,视频、语音、图像等多模态内容的生成与编辑,正营销传播、产品运营、教育培训、客服质检等场景中成为高频需求。现实中,多模态能力多以“单点调用、按量计费”为主,门槛不低、成本波动也更明显,尤其在批量制作、持续迭代的业务里,用户更希望获得稳定、可预期的用量管理与成本控制方式。 (原因)鉴于此,MiniMax近日推出订阅计划Token Plan,尝试用“订阅+额度”的方式,把编程模型与多模态模型的使用路径串联起来。该计划在既有Coding Plan的编程模型用量框架上,扩展至多模态模型调用:Plus/Plus-极速版及以上套餐用户,可在套餐赠送额度内调用视频、语音、音乐、图像生成等能力,且涉及的额度不占用原有编程模型调用配额。平台同时发布M2.7编程模型,作为Token Plan的重要支撑,用于提升性能与适配灵活性。此外,用户可在OpenClaw环境中安装多模态工具集Skill,以提升语音生成、视频创作等流程效率,更贴合批量化内容生产需求。 (影响)业内人士认为,“全模态订阅”模式可能对开发与内容生产两端形成叠加效应:其一,在成本侧提高可预期性。多模态能力纳入统一订阅体系后,有助于降低单次调用带来的预算不确定性,更符合企业按月或按季度的成本管理习惯。其二,在工程侧提升集成效率。多模态能力以工具集方式进入开发工作流,可减少在模型、接口、权限与计费之间频繁切换的摩擦,推动多模态能力从“试用”走向“规模化上线”。其三,在产品侧拓展应用边界。视频、语音、图像与编程能力协同后——可支持更完整的业务闭环——例如“脚本生成—配音—成片—多版本投放”的自动化流水线,从而提升内容迭代速度与触达效率。 (对策)针对企业用户更深层的专业化需求,Token Plan同步提供增购选项,包括“语音资源包”和“视频资源包”,支持调用旗舰语音模型Speech2.8及视频模型Hailuo2.3/2.3-Fast等,并称相比单独调用可节省约20%成本。对企业而言,下一步关键是把模型能力落到可控的生产流程中:一是补齐数据与版权合规管理,尤其在音视频内容场景下,明确素材来源、授权边界与输出审核;二是建立从提示词、模板到质检的标准化体系,降低“效果不稳定”对效率的影响;三是完善评估指标,将生成质量、时延、单条成本、人工返工率等纳入统一考核,形成可改进的闭环。 (前景)从行业趋势看,多模态技术的普及正在从“能力展示”转向“供给方式创新”。订阅计划的价值不只体现在价格上,更在于为开发者提供更稳定的调用边界、为企业提供更可复制的生产模式。未来一段时间,全模态模型的竞争可能集中在三上:一是端到端工具链与生态兼容能力,谁能更快融入主流开发环境与业务系统,谁就更容易形成规模应用;二是生成质量与可控性,尤其在音视频场景中,对一致性、可编辑性、可追溯性的要求更高;三是合规与安全治理能力,包括内容审核、数据安全与风险防控机制。随着市场需求继续分化,面向不同行业的“套餐化”“场景化”能力组合,也可能成为下一阶段的重要方向。
从文本到视听,从“能生成”到“能量产”,多模态技术的价值最终仍取决于是否具备可用、可控、可持续的产品机制。订阅模式的变化不只是计费调整,更是对开发门槛、资源分配与协作方式的一次重构。未来,只有把技术进步与工程能力、应用落地与治理体系同步推进,才能让多模态真正成为数字经济中的新型生产力工具。