瞄准新云AI算力竞争与“Token计费”趋势,Nutanix扩展云平台谋求企业控制层突破

当前全球人工智能技术进入规模化应用阶段,但算力资源管理面临新的挑战。Nutanix公司产品战略负责人近日在技术峰会上表示,AI推理过程中Token生成需求常出现突发变化,导致GPU利用率呈“脉冲式”波动,传统按虚拟机计费的云服务模式因此难以匹配。第三方研究数据显示,典型AI模型的Token处理量日内波动可达300%,企业在成本预测与管控上承受更大压力。

大模型应用从试验走向生产,竞争分水岭正在显现:硬件规模依然重要,但更关键的是将算力转化为可预测的业务产出,并在合规与成本约束下实现持续运营;围绕Token计量、吞吐效率与治理编排的控制层竞争,可能重塑云服务商格局,也将推动企业在“算力获取”之外,更系统地回答“如何使用、如何负责”的问题。