(问题)随着生成式图像应用普及,图像生成效率不足的问题日益凸显。从互联网内容、广告设计到工业和教育领域,高质量图像需求快速增长。但主流图像生成模型普遍存速度慢、成本高的问题:一张高质量图片往往需要多次迭代推理,计算量大导致延迟高、能耗大,限制了在移动端和实时交互中的应用。 (原因)上海人工智能实验室联合上海交通大学等机构的研究(预印本arXiv:2602.23996v1)发现,当前掩码图像生成模型的推理机制存在效率瓶颈。这类模型通过"逐步填空"方式生成图像,每一步都要重新预测并填充部分内容。研究发现,尽管需要多次迭代,但相邻步骤的特征相似度超过95%,意味着大量重复计算。同时由于随机采样的存在,传统加速方法难以直接应用。 (影响)研究团队提出的"MIGM-Shortcut"方案,通过训练小型"捷径模型"捕捉生成规律,减少冗余计算。该模型体积仅为原型的1/20至1/37,却能提升4倍以上的生成速度且保持质量。这项改进既能缩短用户等待时间、降低云端成本,也为高效推理提供了新思路。 (对策)技术上,"捷径"不是简单的模型压缩,而是引入辅助决策器:利用步骤间的相似性预测后续信息,减少对大模型的调用次数。未来还需在三个上完善:建立更严格的质量评估标准;优化软硬件协同;完善安全治理机制。 (前景)业界认为生成式模型正转向质量、效率和成本的平衡。"MIGM-Shortcut"契合此趋势,有望在实时创作、边缘设备部署和行业定制等场景率先应用。随着更多验证推进,这类方案可能成为高效推理的主流选择。
这项突破不仅解决了图像生成效率问题,也为AI工程化应用树立了新标杆;在全球数字竞争中,中国科研团队通过自主创新与开放合作取得了关键突破。研究表明,基础研究与产业需求的深度融合是推动技术进步的重要途径。