亚马逊云计算发布突破性Trainium芯片集群与高性能服务器,挑战Nvidia市场主导地位

发布时间:2024-12-08作者:网翼互联阅读:0

亚马逊云计算部门Amazon Web Services(AWS)近日宣布了两项重大进展:一是推出由数十万颗自研Trainium芯片组成的超级计算集群“Ultracluster”;二是发布全新服务器“Ultraserver”。

image.png

“Ultracluster”是AWS位于德克萨斯州奥斯汀的AI芯片设计实验室开发的最新项目,旨在提升AI模型训练的效率。AWS透露,该集群将用于支持AI初创公司Anthropic的模型训练工作。Anthropic近期获得了亚马逊追加的40亿美元投资,而其训练集群将在“Project Rainier”项目中使用该超级计算集群,预计将成为全球最大的AI训练集群之一,预计于2025年投入使用。AWS表示,“Ultracluster”将提供比Anthropic现有集群高五倍的计算性能,显著加速AI模型的训练过程。

同时,AWS还推出了全新服务器“Ultraserver”,由64颗自研Trainium芯片互联组成,采用创新架构提供强大的算力。Ultraserver的设计将四台服务器整合为一个单一封装,每台服务器包含16颗Trainium芯片。相比之下,某些Nvidia的GPU服务器仅包含8颗芯片。AWS通过其网络技术“NeuronLink”使四台服务器之间高效通信,从而将计算能力提升至83.2 PetaFLOPS。Ultraserver的体积接近于冰箱大小的主机计算机,远大于紧凑型个人电脑。

AWS的AI芯片战略始于2018年发布的Inferentia芯片,专为AI推理计算而设计;2020年推出了AI训练芯片Trainium,随后在2023年发布了更强大的Trainium2,目前该芯片已经对外全面开放使用。AWS透露,下一代Trainium3芯片正在开发中,预计将提供当前版本四倍的性能。

据市场统计,全球AI芯片市场在2024年预计达到1175亿美元,且到2027年将增长至1933亿美元,而Nvidia目前占据了约95%的市场份额。AWS首席执行官Matt Garman表示:“虽然在GPU领域,Nvidia目前几乎占据主导地位,但我们相信客户需要更多选择,我们将继续推动技术创新,提供更广泛的解决方案。”


标题:亚马逊云计算发布突破性Trainium芯片集群与高性能服务器,挑战Nvidia市场主导地位

TAG标签:

上一篇:2024算力产业大会:聚焦技术创新,共建高质量算力生态
下一篇:人工智能时代新高地:xAI在孟菲斯启动超级计算集群十倍扩展计划
返回顶部