3月16日,据IT之家消息,亚马逊AWS与顶尖AI芯片企业Cerebras于本月13日宣布了一项重要合作。未来数月内,亚马逊的Amazon Bedrock平台将整合双方芯片技术,部署一套混合AI推理系统,旨在实现业界领先的负载处理速度。

据介绍,该解决方案将深度融合Cerebras的CS-3系统、亚马逊AWS的Trainium芯片以及EFA弹性网络适配器。其中,Trainium芯片主要负责推理的预填充(即提示处理)环节,CS-3系统则承担解码(输出生成)任务,两者通过高效的EFA网络紧密协同。

IT之家了解到,推理预填充属于并行计算密集型工作,需要强大的算力与适中的内存带宽支持;而推理解码本质上是串行过程,对算力要求相对较低,但对内存带宽的需求极高。通过组合使用Trainium与CS-3,能够充分发挥两款AI芯片各自的架构优势,从而为用户带来极致高效的最终体验。
