Coelacanth-Dream这一回真是让大家开了眼,它发布博文揭露说AMD在RDNA 5显卡核心上的指令优化给部分游戏场景带来了近100%的性能提升。这里头关键的一招是引入了双发射向量算术逻辑单元(Dual Issue VALU)。简单来说,就好比把收费站的单车道变成了双车道,一个时钟周期内就能处理两条指令。这个技术其实AMD早就用上了,只是之前的编译器没法有效利用。为了突破这个调度瓶颈,AMD这次把融合乘加(FMA)指令给搬了进来。这招让编译器能轻松配对复杂的ALU操作,顺利把它们分发到两个计算通道里。这下好了,GPU终于能像预期那样把双发射VALU的硬件资源给用满了。结果就是大家在玩传统光栅化游戏时能看到更高也更稳的帧率。不光是游戏受益,FMA指令对做AI工作负载也至关重要。以后AMD要搞AI驱动的图像超分技术(比如FSR Diamond)和帧生成技术时,这项技术就能派上大用场。咱们也能看到IT产业在这个领域里的进步。