记者从上海交通大学获悉,该校致远一号智能算力平台于今日正式启用。
这一平台采用全国产化硬件架构,配置1024张昇腾910B加速卡,FP16精度下峰值算力达到313P,总存储容量13.6PB,成为目前国内高校领域规模最大的智能计算基础设施。
平台架构采用三区协同设计理念。
智算集群区部署128台国产服务器,搭载1024张神经网络处理单元,峰值算力320P,单机柜功率30千瓦。
网络架构按照不同功能需求分为参数传输、业务处理和样本数据三个独立平面,其中参数面采用200GE高速网络,收敛比达到1比1,确保大规模并行计算的高效协同。
云平台区基于国产操作系统和模型开发平台,配置101台服务器形成超过5000个虚拟计算核心的通用计算资源池,提供从基础设施到软件应用的全栈云服务能力。
存储区采用全闪存与混合闪存双架构,总容量达到9PB,为并行计算和大规模模型训练提供高吞吐数据支撑。
在基础设施保障方面,致远一号机房建设采用封闭微模块设计,共设52个加高机柜分布在3组独立单元中。
供电系统额定功率960千瓦,配电总功率1380千瓦,采用小母线架构和双路电源分配单元,关键设备接入不间断电源,断电状态下可维持15分钟持续运行。
制冷系统配置30台精密空调,单台制冷功率60千瓦,按照冗余方案部署,采用氟泵双循环自然冷却技术,年均能效比约为1.3,在保障设备稳定运行的同时实现节能降耗。
致远一号平台已完成8款主流大语言模型的本地化部署,支持从基础架构服务到软件应用服务的多层次需求。
平台具备异构算力智能调度和云化弹性部署能力,可同时满足教学实验、科学研究和管理服务等多元化应用场景。
101台通用计算节点构成的计算池,能够灵活应对不同规模和类型的计算任务,实现算力资源的高效利用。
上海交通大学高性能计算中心负责人表示,从2013年建成首个集群到今天致远一号的全面落地,学校在高性能计算领域已有十余年的建设积累。
上一代平台思源一号建于2021年,总算力6千万亿次每秒,采用双路处理器架构和温水冷却技术,拥有938个计算节点和23个加速计算节点。
致远一号的建成使学校智算能力提升超过50倍,标志着高校科研算力建设进入新的发展阶段。
据了解,当前人工智能技术快速发展对算力提出更高要求,大规模模型训练、科学计算仿真、数据密集型研究等应用场景对算力的需求呈指数级增长。
高校作为基础研究和人才培养的重要阵地,建设自主可控的高性能计算平台,对于推进科技创新、培养专业人才、服务国家战略具有重要意义。
致远一号采用国产化硬件体系,在保障信息安全的同时,为相关技术的迭代优化提供了应用场景和反馈机制。
业内专家认为,致远一号的建成体现了我国在高性能计算领域的技术进步和产业能力。
通过大规模集群的实际部署和应用验证,有助于推动国产算力生态的完善,为更多科研机构和企业用户提供可靠的技术选择。
同时,平台开放的服务模式将促进产学研协同创新,加速科研成果向实际应用的转化。
"致远一号"的建成不仅是一所高校的技术升级,更是我国高等教育领域推进科技自立自强的生动实践。
在全球化竞争格局深刻变革的今天,以自主创新为核心的高性能计算体系建设,正在为破解重大科学难题、培育战略新兴产业构筑新的基石。
这启示我们,只有牢牢掌握关键核心技术,才能在未来的科技竞争中赢得战略主动。