国产高速互连要想出头，国内算力基础才算真正过硬

说到国内AI算力这块，现在发展得那叫一个快，特别是那高速互连网络，简直是要把关键环节给打通了。智通财经的APP那边刚传来消息，中金的这份研报说得挺透，说AI算力集群现在正往万卡、十万卡这种大规模去变，而这中间的关键，就是那个被称作“神经枢纽”的高速互连网络。要是这网不通顺，再好的集群也发挥不出真正的实力。目前看，这块的生态主要还是靠着InfiniBand还有RoCE v2在撑着，技术和生态老早就被国外厂商把持着。不过咱们也别急，随着国内基建的推进，国产的高速互连系统已经到了破局的关键时刻。中金觉得，国产的RDMA高速互连要想出头，得从底层架构和硬件上下功夫。通过这种方式把国产替代的路走通了，国内的算力基础才算真正过硬。这背后的原因是因为RDMA有个叫“内核旁路”和“零拷贝”的特性，它能绕开操作系统和CPU的调度直接读写远程内存，这样一来延迟少了，CPU也能省不少力气。现在市面上主流的RDMA方案主要有IB、RoCE和iWARP三种。IB是专门为这个设计的原生网络，端到端的无损性能绝对是头一把交椅；RoCE呢是把这套架构挪到了以太网环境里，RoCE v2靠的是优先流量控制和显式拥塞通知这种流控机制来调优网络，硬是在传统的有损网里模拟出了无损传输的感觉。说到具体怎么落地，海外大厂在高端互连这块话语权很强的情况下，国产的高速互连网络也在慢慢打破局面。中科曙光推出来的scale Fabric就是个很好的例子。这是国内自研的400G原生无损RDMA架构，用的机制跟InfiniBand一样是信用流控加链路层重传。它还有类IB的原生RDMA网卡和交换芯片支持，带宽能跑到400Gb/s以上，端侧延迟还不到1微秒。目前scale Fabric已经成了国产万卡级智算集群落地的基石了，帮助scaleX万卡超集群成功落地了。接下来就是要助力大规模国产算力集群加速部署了。至于标的方面嘛，中科曙光(603019.SH)这块倒是挺值得关注的。当然了风险还是有的，要是国产互连生态成熟得没那么快或者算力建设不如预期的话，可能会有变数。