“人工智能+”的战略就能走得更稳当

国产芯片最近搞出了个大新闻，上海那边的实验室弄出了个叫DeepLink的方案，终于把国产芯片们拉到了一起，共同去干大事。大家都知道现在人工智能特别火，以前大家都盯着训练阶段使劲儿，但现在各行各业都在找能让模型实时干活的东西，也就是推理算力。可是国产芯片以前就像个孤岛一样，各个厂家的芯片凑不到一块儿去，造成了很大的浪费。上海人工智能实验室这回算是破局了，他们自己研发的DeepLink混合推理框架让这些不同的芯片终于能互相配合了。这就好比是组建了一支全明星球队，让擅长进攻的芯片去冲锋陷阵，精于组织的芯片掌控节奏。为了达到这个效果，技术团队弄了个预填充解码分离架构（PD分离），在那个上千卡规模的集群里一测，发现首字响应时间居然缩短了34.5%，整体吞吐量也提高了32%。这样一来，用户跟AI对话的时候就能感觉到明显的快，也更顺畅了。支撑这一整套系统的有三个关键部分：策略求解器DLSolver就像个考官，专门去评估每块芯片的性能；智能路由系统DLRouter像指挥官一样实时调配任务；异构通信库DLSlime则是搭建了芯片之间的高速通道。这三个家伙凑在一起构成了调度中枢。产业方面也没闲着，这个方案已经适配了昇腾、沐曦等8个主流品牌，平均性能提升超过20%。这就意味着在不用多花钱的情况下，大家能得到相当于降低20%成本的算力提升。现在很多省级的算力中心都开始用这套技术了，预计能盘活数万PFLOPS的闲置资源。这个突破和实验室去年发布的混合训练框架合在一起，就把从训练到推理的整个流程都给打通了。通过降低对特定硬件的依赖度，给咱们的国产算力生态提供了新路子。专家说随着更多芯片加入进来，咱们AI产业就能形成一个“多芯协同”的新环境，“人工智能+”的战略就能走得更稳当。