埃隆·马斯克创立的xAI最近把全球首个吉瓦级人工智能训练集群Colossus 2给搞活了。这个大家伙就落在了美国田纳西州孟菲斯市,是为了伺候他的聊天机器人Grok准备的。马斯克在社交媒体上说,这已经是1吉瓦的算力了,打算今年4月把它拔升到1.5吉瓦。这个项目占地面积得有13个标准足球场那么大,还准备继续扩张。里面塞了20万块英伟达H100 GPU,光是GPU的数量从2024年夏天开始就翻了一倍。要养活这么大一堆家伙得消耗不少电,这个超级计算机给本地电网的电力供应需求就达到了150兆瓦。为了防止断电或者电力峰值出现问题,它还配了一个同等功率的特斯拉Megapack储能电池作为备用。 不过就在大家伙刚跑起来的时候,有消息传出xAI曾经在田纳西州违规用天然气涡轮发电机给Colossus数据中心供电。美国环境保护署审查了一年多之后说这行为违规了。这样一来,大家就把视线都放到了高性能计算带来的能源问题上。要知道现在的大模型训练可真是耗电大户。随着模型参数越来越大,需要的计算量和能耗也是水涨船高。现在好多科技巨头都在拼命建自己的大型集群呢。 虽然这事儿让行业里的人都开始头疼起来了,不过这也是行业竞争的一个缩影。一方面显示了大家想通过自建超级基础设施来抢算力优势;另一方面也暴露了在快速部署过程中可能遇到的与现有能源和环保监管的摩擦。以后搞人工智能不能光看算力规模能不能大起来,还得把能效和绿色能源这些事儿给规划进去。要不然这产业的长期发展就悬了。这次Colossus 2的投入运行确实是个里程碑式的事件。但随之而来的能源消耗和环保合规问题也给整个行业敲响了警钟。以后这比赛不光比算法和数据了,还得比谁更节能环保才行。 要想把技术做到顶尖又得环保可持续,这事儿还真不容易得大伙儿一起商量着来办才行啊!