国产高速互连要想出头,国内算力基础才算真正过硬

说到国内AI算力这块,现在发展得那叫一个快,特别是那高速互连网络,简直是要把关键环节给打通了。智通财经的APP那边刚传来消息,中金的这份研报说得挺透,说AI算力集群现在正往万卡、十万卡这种大规模去变,而这中间的关键,就是那个被称作“神经枢纽”的高速互连网络。要是这网不通顺,再好的集群也发挥不出真正的实力。目前看,这块的生态主要还是靠着InfiniBand还有RoCE v2在撑着,技术和生态老早就被国外厂商把持着。不过咱们也别急,随着国内基建的推进,国产的高速互连系统已经到了破局的关键时刻。 中金觉得,国产的RDMA高速互连要想出头,得从底层架构和硬件上下功夫。通过这种方式把国产替代的路走通了,国内的算力基础才算真正过硬。这背后的原因是因为RDMA有个叫“内核旁路”和“零拷贝”的特性,它能绕开操作系统和CPU的调度直接读写远程内存,这样一来延迟少了,CPU也能省不少力气。现在市面上主流的RDMA方案主要有IB、RoCE和iWARP三种。IB是专门为这个设计的原生网络,端到端的无损性能绝对是头一把交椅;RoCE呢是把这套架构挪到了以太网环境里,RoCE v2靠的是优先流量控制和显式拥塞通知这种流控机制来调优网络,硬是在传统的有损网里模拟出了无损传输的感觉。 说到具体怎么落地,海外大厂在高端互连这块话语权很强的情况下,国产的高速互连网络也在慢慢打破局面。中科曙光推出来的scale Fabric就是个很好的例子。这是国内自研的400G原生无损RDMA架构,用的机制跟InfiniBand一样是信用流控加链路层重传。它还有类IB的原生RDMA网卡和交换芯片支持,带宽能跑到400Gb/s以上,端侧延迟还不到1微秒。目前scale Fabric已经成了国产万卡级智算集群落地的基石了,帮助scaleX万卡超集群成功落地了。接下来就是要助力大规模国产算力集群加速部署了。至于标的方面嘛,中科曙光(603019.SH)这块倒是挺值得关注的。 当然了风险还是有的,要是国产互连生态成熟得没那么快或者算力建设不如预期的话,可能会有变数。