异构算力调度平台获融资密瓜智能推动GPU利用率翻倍提升

问题——需求高企与低效使用并存，算力成为企业数字化升级的“卡点”。

随着大模型训练与推理从试点走向规模化应用，算力已成为新型基础资源。

然而在不少企业内部，GPU等加速资源仍沿用“静态独占、按卡分配”的传统方式：业务峰值时争抢资源、业务低谷时资源闲置，导致总体利用率偏低，算力成本难以有效摊薄。

与此同时，国产算力与多样化芯片持续涌现，企业机房、云上与边缘侧设备呈现“多厂商、多架构、多代际”并存的格局，进一步放大了调度与运维复杂度。

原因——异构环境加速形成，“缺统一语言”成为效率瓶颈。

从技术层面看，算力低利用率并非单纯的硬件不足，而是管理与调度手段滞后：一是异构芯片能力差异大，驱动、工具链与监控体系难以统一，导致资源难以池化；二是资源切分粒度粗，无法按任务实际需求分配显存与算力，形成“用不满又分不出”的浪费；三是业务类型日益多样，训练、微调、推理、评测等任务并行运行，对弹性扩缩容、优先级保障与稳定性提出更高要求。

上述因素叠加，使企业即便采购了算力，也难以形成可持续的高效供给能力。

影响——从成本压力到创新速度，算力效率直接关联竞争力。

算力利用率偏低带来的影响首先体现在成本端：同等业务规模下需要更多硬件投入与机房资源，推高总拥有成本；其次体现在效率端：模型迭代周期被拉长，研发排队与资源抢占影响交付节奏；再次体现在治理端：异构资源缺乏统一管理标准，容易形成“烟囱式系统”，增加安全合规与运维风险。

对产业而言，若不能把“算力供给”从单点采购升级为体系化运营，算力紧张将持续制约大模型应用的普及与深化。

对策——以开源为抓手，推动异构算力池化与细粒度调度。

此次完成天使轮融资的密瓜智能，定位于异构算力虚拟化与高效调度管理。

其核心抓手是其发起并主导的开源项目HAMi，目标是为异构算力调度提供可复用的标准化能力，推动算力资源从“静态独占”向“动态解耦”转变。

相关思路包括：其一，通过细粒度切分，实现单卡显存与算力按需分配，并在资源共享中引入更灵活的配置机制，提高单卡承载密度；其二，推进跨厂商适配，使不同架构的GPU及各类AI加速芯片纳入同一资源池管理，降低异构环境下的调度门槛；其三，强化弹性能力与优先级机制，在资源紧张时保障关键任务稳定运行；其四，与云原生体系融合，减少对现有业务代码的改造成本，推动能力在生产环境快速落地。

业内人士认为，在算力供需矛盾短期难以彻底缓解的情况下，通过调度与虚拟化手段“向管理要效率”，具有现实可行性。

从实践看，相关方案已在部分场景验证了提升空间。

例如在物流与互联网教育等业务场景中，通过更精细的资源切分与调度，企业可在有限GPU资源上并行承载更多服务，减少因“按卡独占”导致的浪费，进而在一定程度上缓解新增采购压力。

公司方面表示，本轮资金将主要用于开源生态建设及产业化落地，同时也将面向企业提供付费产品与交付服务，以满足安全、稳定、运维与性能等生产级需求。

前景——算力将走向“可运营的基础设施”，标准化与生态是关键变量。

面向未来，企业算力建设正从“买设备”转向“建体系”：一方面，大模型应用将持续扩张，推理侧的高并发与低时延需求将驱动更精细的资源管理；另一方面，国产芯片与多元硬件形态将长期并存，异构调度能力将成为企业基础设施的“底座能力”。

在此背景下，开源项目若能形成可验证的技术路线与广泛的生态协作，有望推动行业形成更统一的接口与规范，降低企业采用新算力的门槛。

但同时也应看到，显存超配、任务隔离、性能稳定性与安全治理等议题仍需在更多生产场景中经受检验，行业也需要在标准、测试与合规层面建立更完善的评估体系。

算力资源的高效利用既是技术问题，更是发展命题。

此次创新成果的出现，标志着我国在数字基础设施建设领域正从规模扩张向质量提升转变。

在数字经济成为全球经济复苏新引擎的背景下，通过技术创新挖掘算力潜能、优化资源配置，不仅关乎单个企业的降本增效，更将成为推动产业智能化转型、筑牢数字中国底座的重要支撑。

未来，随着更多原创性技术的涌现，我国有望在全球数字治理体系重构中贡献更多中国智慧。

异构算力调度平台获融资 密瓜智能推动GPU利用率翻倍提升

异构算力调度平台获融资密瓜智能推动GPU利用率翻倍提升