群发资讯网

亚马逊推出AI工厂解决方案,让用户选择英伟达芯片,还是Trainium

与谷歌直接向客户推销TPU不同,亚马逊也推出了自研的 Trainium 芯片,但是却将使用谁家芯片的权利交给用户。在20

与谷歌直接向客户推销TPU不同,亚马逊也推出了自研的 Trainium 芯片,但是却将使用谁家芯片的权利交给用户。

在2025 Re:Invent 会议上,亚马逊公布了 Trainium 3芯片和AI工厂解决方案。

在AI训练和推理方面,Trainium 3 比上一代芯片的性能更强。搭载 Trainium 3的系统,速度提高了4倍,内存的容量也增加了4倍。每台超级计算机可以集成144块芯片,数千台超级计算机可以连接起来,组成多达100万块 Trainium 3芯片的计算机集群。

为了吸引关注,亚马逊强调 Trainium 3的能效提升了40%。日本 LLM Karakuri 、 SplashMusic 和 Decart 等亚马逊客户,在使用亚马逊配置 Trainium 3 的系统时,推理成本大幅度降低。

亚马逊表示会将包括英伟达 GPU 、Trainium 3以及云存储等产品融入到客户自己的AI工厂。亚马逊会专门为客户运营他们的AI工厂。这样不仅可以方便政府和大型组织机构更加专心地开展 AI 项目,还能确保合规。

这些 AI 工厂就像亚马逊的私有云一样,客户可以继续获得亚马逊云的管理服务,包括基础模型,控制数据的处理和存储。

至于具体选择哪家的产品,亚马逊让用户自己选择,除了可以选择亚马逊自己的产品外,还可以继续选择英伟达的 GPU 、软件和计算平台。亚马逊也表示,Nitro 系统、弹性结构适配器(EFA)PB 级网络和 Amazon EC2 UltraClusters 将会继续支持英伟达 Blackwell 和下一代 Rubin 芯片。

亚马逊还公布了下一代芯片 Trainium 4的一些技术路线,除了提升芯片性能外,还将兼容英伟达NVLink Fusion 技术。

这意味着搭载 Trainium 4 的超级计算机能够借助英伟达 GPU 提升性能,还能够继续使用亚马逊开发的低成本服务器工作。

英伟达 Hyperscale 和 HPC 高管也表示,大规模 AI 开发需要全栈的方法,会和亚马逊一起向用户提供,他们所需的硬件、软件和服务。英伟达的技术也会帮助亚马逊 AI 工厂迅速建立 AI 功能,使其专注于创新,而非集成。

上个月亚马逊与沙特 AI 公司 Humain 宣布,将会部署15万块 GB300 和 Trainium。这将为了亚马逊AI 工厂的柔性解决方案提供一个样板。

从这一点来看,亚马逊似乎比谷歌更聪明!

图片来源:亚马逊