问题——需求高企与低效使用并存,算力成为企业数字化升级的“卡点”。
随着大模型训练与推理从试点走向规模化应用,算力已成为新型基础资源。
然而在不少企业内部,GPU等加速资源仍沿用“静态独占、按卡分配”的传统方式:业务峰值时争抢资源、业务低谷时资源闲置,导致总体利用率偏低,算力成本难以有效摊薄。
与此同时,国产算力与多样化芯片持续涌现,企业机房、云上与边缘侧设备呈现“多厂商、多架构、多代际”并存的格局,进一步放大了调度与运维复杂度。
原因——异构环境加速形成,“缺统一语言”成为效率瓶颈。
从技术层面看,算力低利用率并非单纯的硬件不足,而是管理与调度手段滞后:一是异构芯片能力差异大,驱动、工具链与监控体系难以统一,导致资源难以池化;二是资源切分粒度粗,无法按任务实际需求分配显存与算力,形成“用不满又分不出”的浪费;三是业务类型日益多样,训练、微调、推理、评测等任务并行运行,对弹性扩缩容、优先级保障与稳定性提出更高要求。
上述因素叠加,使企业即便采购了算力,也难以形成可持续的高效供给能力。
影响——从成本压力到创新速度,算力效率直接关联竞争力。
算力利用率偏低带来的影响首先体现在成本端:同等业务规模下需要更多硬件投入与机房资源,推高总拥有成本;其次体现在效率端:模型迭代周期被拉长,研发排队与资源抢占影响交付节奏;再次体现在治理端:异构资源缺乏统一管理标准,容易形成“烟囱式系统”,增加安全合规与运维风险。
对产业而言,若不能把“算力供给”从单点采购升级为体系化运营,算力紧张将持续制约大模型应用的普及与深化。
对策——以开源为抓手,推动异构算力池化与细粒度调度。
此次完成天使轮融资的密瓜智能,定位于异构算力虚拟化与高效调度管理。
其核心抓手是其发起并主导的开源项目HAMi,目标是为异构算力调度提供可复用的标准化能力,推动算力资源从“静态独占”向“动态解耦”转变。
相关思路包括:其一,通过细粒度切分,实现单卡显存与算力按需分配,并在资源共享中引入更灵活的配置机制,提高单卡承载密度;其二,推进跨厂商适配,使不同架构的GPU及各类AI加速芯片纳入同一资源池管理,降低异构环境下的调度门槛;其三,强化弹性能力与优先级机制,在资源紧张时保障关键任务稳定运行;其四,与云原生体系融合,减少对现有业务代码的改造成本,推动能力在生产环境快速落地。
业内人士认为,在算力供需矛盾短期难以彻底缓解的情况下,通过调度与虚拟化手段“向管理要效率”,具有现实可行性。
从实践看,相关方案已在部分场景验证了提升空间。
例如在物流与互联网教育等业务场景中,通过更精细的资源切分与调度,企业可在有限GPU资源上并行承载更多服务,减少因“按卡独占”导致的浪费,进而在一定程度上缓解新增采购压力。
公司方面表示,本轮资金将主要用于开源生态建设及产业化落地,同时也将面向企业提供付费产品与交付服务,以满足安全、稳定、运维与性能等生产级需求。
前景——算力将走向“可运营的基础设施”,标准化与生态是关键变量。
面向未来,企业算力建设正从“买设备”转向“建体系”:一方面,大模型应用将持续扩张,推理侧的高并发与低时延需求将驱动更精细的资源管理;另一方面,国产芯片与多元硬件形态将长期并存,异构调度能力将成为企业基础设施的“底座能力”。
在此背景下,开源项目若能形成可验证的技术路线与广泛的生态协作,有望推动行业形成更统一的接口与规范,降低企业采用新算力的门槛。
但同时也应看到,显存超配、任务隔离、性能稳定性与安全治理等议题仍需在更多生产场景中经受检验,行业也需要在标准、测试与合规层面建立更完善的评估体系。
算力资源的高效利用既是技术问题,更是发展命题。
此次创新成果的出现,标志着我国在数字基础设施建设领域正从规模扩张向质量提升转变。
在数字经济成为全球经济复苏新引擎的背景下,通过技术创新挖掘算力潜能、优化资源配置,不仅关乎单个企业的降本增效,更将成为推动产业智能化转型、筑牢数字中国底座的重要支撑。
未来,随着更多原创性技术的涌现,我国有望在全球数字治理体系重构中贡献更多中国智慧。