近日,科技巨头马斯克旗下的xAI项目迎来重要里程碑,其孟菲斯超级集群的第一阶段已全面投入运营。据外媒报道,该集群的变电站已正式接入主电网,开始稳定供电。
据悉,孟菲斯超级集群将从当地多部门获取高达150兆瓦的电力供应。不仅如此,为了确保电力供应的稳定性,xAI的Colossus超级计算机还配备了同样容量的特斯拉Megapack电池作为备用电源,以应对突发停电或电力需求激增的情况。
回顾去年7月,马斯克首次启动了这一AI集群。当时,集群内部已经安装了10万块英伟达H100 GPU,并通过单一架构实现了高效连接。这一超级计算机的搭建速度惊人,仅用了19天便投入使用,远远低于英伟达CEO黄仁勋所提到的四年常规周期。
然而,这种快速部署也带来了一些挑战。最初,由于尚未接入电网,孟菲斯超级集群只能依赖天然气涡轮发电机供电。据初步统计,现场最初部署了14台2.5兆瓦的发电机。但近期,当地居民发现现场及其周边涡轮机的数量已经超过了35台。
随着变电站的正式接入,孟菲斯超级集群现在可以完全依靠田纳西河谷管理局(TVA)提供的电力。TVA的电力供应中约60%来自水力、太阳能、风能和核能等可再生能源。因此,xAI计划停用约一半的临时发电机,但仍需保留部分发电机以满足第二阶段建设的电力需求。
第二座变电站计划在今年秋季上线,将再提供150兆瓦的电力供应。届时,Colossus的总电力需求将达到300兆瓦,这一电量足以满足30万户家庭的用电需求。电力供应商已向各方保证,他们能够在不影响其他用户的前提下,为孟菲斯超级集群提供充足的电力。
Colossus在2024年7月启动时配备了10万块英伟达H100 GPU。而到了2025年2月,GPU的数量已经翻倍至20万块。马斯克有着更大的计划,他打算将孟菲斯超级集群的规模扩展到100万块GPU,并正在积极筹集资金以实现这一目标。