“人工智能+”的战略就能走得更稳当

国产芯片最近搞出了个大新闻,上海那边的实验室弄出了个叫DeepLink的方案,终于把国产芯片们拉到了一起,共同去干大事。大家都知道现在人工智能特别火,以前大家都盯着训练阶段使劲儿,但现在各行各业都在找能让模型实时干活的东西,也就是推理算力。可是国产芯片以前就像个孤岛一样,各个厂家的芯片凑不到一块儿去,造成了很大的浪费。 上海人工智能实验室这回算是破局了,他们自己研发的DeepLink混合推理框架让这些不同的芯片终于能互相配合了。这就好比是组建了一支全明星球队,让擅长进攻的芯片去冲锋陷阵,精于组织的芯片掌控节奏。 为了达到这个效果,技术团队弄了个预填充解码分离架构(PD分离),在那个上千卡规模的集群里一测,发现首字响应时间居然缩短了34.5%,整体吞吐量也提高了32%。这样一来,用户跟AI对话的时候就能感觉到明显的快,也更顺畅了。 支撑这一整套系统的有三个关键部分:策略求解器DLSolver就像个考官,专门去评估每块芯片的性能;智能路由系统DLRouter像指挥官一样实时调配任务;异构通信库DLSlime则是搭建了芯片之间的高速通道。这三个家伙凑在一起构成了调度中枢。 产业方面也没闲着,这个方案已经适配了昇腾、沐曦等8个主流品牌,平均性能提升超过20%。这就意味着在不用多花钱的情况下,大家能得到相当于降低20%成本的算力提升。现在很多省级的算力中心都开始用这套技术了,预计能盘活数万PFLOPS的闲置资源。 这个突破和实验室去年发布的混合训练框架合在一起,就把从训练到推理的整个流程都给打通了。通过降低对特定硬件的依赖度,给咱们的国产算力生态提供了新路子。专家说随着更多芯片加入进来,咱们AI产业就能形成一个“多芯协同”的新环境,“人工智能+”的战略就能走得更稳当。