Cressy 作者:Ao Fei Si Qubits | QbitAI公众号 英伟达和谷歌正在争夺天空。一颗由 NVIDIA H100 驱动的卫星本月被送入太空,谷歌也不甘落后。 CEO皮查伊表示,TPU也将发射,首批两颗卫星将于2027年初发射。未来,两家公司都计划在太空建设吉瓦级数据中心。网友表示,在太空部署算力的想法真的很酷。但这一领域的领先者并不是英伟达或谷歌,而是很早就开始部署空间计算能力的中国公司。 AI芯片即将升上天空。 Nvidia 芯片将由 Starcloud 送上天堂,Starcloud 是一家主要由 Inception 项目培育的初创公司。本月刚刚发射的星云一号卫星搭载的H100重60公斤,大约有一个小冰箱大小。 梦想我们选择NVIDIA芯片,因为星云需要与数据媲美的性能地球中心和 NVIDIA GPU 为训练、调整和推理提供最佳性能。 StarCloud 1 从合成孔径雷达 (SAR) 卫星星座接收数据,在太空中实时处理数据,然后将其传输到地球。同时,Starcloud也是Google for Startups Cloud AI加速器计划的“校友”。 H100将用于在轨道上运行谷歌开源Gemma模型,展示在太空运行大规模语言模型的可行性。 StarCloud 计划明年开始商业服务,然后将布莱克威尔送上太空。最终目标是建设一个功率为5吉瓦、面积约2.5英里(约4公里)的在轨数据中心。首席执行官 Philip Johnston 预测,10 年内所有 nNew 数据中心都将建在太空中。谷歌起步稍晚,计划将自己的 TPU 送入太空。两颗原型卫星计划于 2027 年初发射,谷歌将其称为阳光捕手计划。原因是计算星座中的所有卫星都是太阳能供电的,卫星之间的通信链路也是通过自由空间光通信实现的。前两颗卫星原型将测试谷歌的 TPU 在太空中的实际工作方式,验证光通信链路,并探索执行分布式机器学习任务的可行性。从长远来看,谷歌的最终目标是在太空建立千兆瓦级数据中心。太空部署的好处和挑战两家公司都展示了在太空部署计算设备的好处,谷歌还专门为此目的发表了文章。首先是成本优势。 StarCloud 提供的数据表明,即使包括发射成本,太空能源的成本也仅为地面解决方案的十分之一。谷歌在这里提供了更具体的计算。假设 LEO 发射成本降至: 每公斤 200 美元,卫星年平均能源成本可降至每千瓦年 810 美元。这相当于当前美国数据中心的能源成本范围为 570 美元至 3,000 美元。而且发射成本正在下降。以SpaceX为例,历史数据显示,每年的发射有效载荷增加了一倍,单位成本下降了20%。如果这条曲线成立,到2035年,发射成本预计将降至每公斤200美元以下。如果航天器被重复使用,根据马斯克的说法,发射成本预计将降至每公斤60美元甚至15美元,而且成本还将继续以加速的速度下降。成本低廉的一个重要原因是电力的可用性。根据谷歌的一篇文章,太阳能的发电量比人类发电总量高出100万亿倍以上。在合适的轨道上,太阳能电池板的效率是地球上的八倍,并且几乎可以连续发电,从而减少了对电池和醋的需求。接下来是热d耗散。与地球上许多依靠蒸发塔和淡水进行冷却的数据中心不同,StarCloud 的太空数据中心可以像无限散热器一样利用深空的真空。英伟达和星云联合开发了一种真空散热架构,将H100发出的热量通过高导热材料从卫星外壳传导到表面,并以红外辐射的形式释放到太空中。此外,还有卫星数据的在轨处理。当其他卫星产生的数据传输到地球进行计算时,会消耗大量的通信资源。使用太空卫星可以在轨道上完成计算并且仅发送计算结果,从而减轻了通信压力。星云对SAR卫星数据的处理就是这个方向的尝试。谷歌正在进一步核实。例如,对于通信链路,我们已经成功地我们在实验中部署了商用的DWDM模块(例如PM-16QAM 400G光模块),实现了单向800 Gbps的短距离光通信(双向1.6 Tbps),证明了该模块可以在小型卫星群中使用。它还控制大型卫星。我们的模型表明,只需适度的轨道机动即可维持星座的稳定运行。 TPU 还具有抗辐射性能。谷歌表示,即使是 HBM 的敏感组件,只有在累积剂量达到 2,000 rad (Si) 时才会开始出现异常,这几乎是五年任务预期剂量的三倍。总体而言,天基机器学习计算的核心概念并不受物理基本定律或难以克服的经济障碍的限制,但许多重要的工程挑战仍然存在,例如热管理、高带宽地面通信和在轨系统的可靠性。具有计算能力的国产卫星通常用于商业目的。星云H100已经完成发射升空。谷歌的 TPU 需要等待一年多才能到达太空。然而,距离我国首个空间算力星座发射已经快半年了。今年5月,《三体电脑公司》浙江学院.首批12颗“Nstellation”卫星发射入轨。这12颗计算卫星均具备空间计算和互联能力,并设有浙江研究院。它将负责开发空间计算软件和硬件,包括智能计算机和空间模型,以实现“天空中的计算能力、轨道上的网络和天空中的模型”。与传统应用卫星相比,计算卫星将单颗卫星的计算能力从T级提升到P级。第一星座在轨算力将达los 5POPS,将大幅提升单颗卫星的高性能空间计算能力。这些卫星还可以形成类似“互联网”的互连。卫星之间采用激光通信,通信速度高达100 Gbps。今年9月,该星座实现正常商业运营。现在,有了英伟达和谷歌的参与,这场AI太空竞赛变得越来越精彩。 [1]https://blogs.nvidia.com/blog/starcloud/?linkId=100000388085273[2]https://research.google/blog/exploring-a-space-based-scalable-ai-infrastructor-system-design/
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号社交媒体平台用户上传发布,提供信息仅限信息存储服务。

你也可能喜欢

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注