亚马逊部署Cerebras芯片方案,极速推理驱动AI变革
亚马逊云服务与芯片初创公司Cerebras宣布达成多年合作协议,将在其数据中心部署Cerebras芯片,用于AI推理计算。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
3月13日周五,根据双方公布的协议,亚马逊云服务将把Cerebras芯片与自研Trainium芯片组合部署,以提供更高速的推理计算服务。
这也是继今年1月OpenAI与Cerebras签署逾百亿美元合作协议之后,这家初创公司再度获得大型科技巨头背书。
Cerebras将其芯片标榜为"极速推理解决方案",并表示它们可以处理被称为"解码"的复杂任务,即推理计算阶段,人工智能模型在此阶段对用户查询做出响应,速度比英伟达的GPU快25倍。
此次合作对Cerebras的商业版图具有重要意义。Cerebras首席执行官Andrew Feldman表示:
越来越多人开始使用人工智能,使用频率也越来越高,并且用它来解决更复杂的问题。这使得Cerebras-Trainium解决方案能够接入最大的云平台,让我们有机会接触到大量的客户。
推理市场崛起,GPU主导地位受压
AI行业算力需求的重心正悄然转移。
随着AI工具和智能体的用户规模迅速扩张,训练阶段的算力需求趋于饱和,推理计算的重要性日益凸显。企业普遍认识到,GPU虽在模型训练中表现出色,但在要求极致响应速度的推理工作负载上并非最优选择,这促使各方加快多元化供应商布局。
AWS作为全球最大的云服务提供商,此前主要依赖旗下Annapurna Labs半导体业务设计的Trainium芯片为数据中心提供算力支持。
此次引入Cerebras芯片,意在弥补Trainium在高速推理场景下的局限,并在推理产品线上提供分层定价方案,速度较慢的纯Trainium服务将以更低价格提供,而Cerebras与Trainium的组合方案则定位高端。
AWS联合创始人、副总裁Nafea Bshara表示,该公司的目标是"持续推进速度提升并降低价格"。Feldman则直言:
如果你希望获得快速token输出,如果速度对你至关重要,如果你在从事代码或智能体工作,我们不仅是绝对最快的,而且我们意在设定行业标准。
英伟达压力加剧,定制芯片势力扩张
这笔交易是英伟达面临日益激烈竞争的缩影。
定制处理器设计商正以专项场景突破的方式蚕食英伟达的市场份额,客户对更快速度和更低成本的诉求也在倒逼芯片巨头加速产品迭代。
据报道,英伟达去年12月与芯片初创公司Groq签署了一项价值200亿美元的授权协议,并计划于近期发布采用Groq技术、专门面向推理场景的新型处理系统。
对Cerebras而言,与AWS的合作发生在其业务高速扩张的关键节点。
今年2月,Cerebras宣布完成10亿美元新一轮融资,累计融资总额升至26亿美元,投后估值约为230亿美元。
今年1月,ChatGPT开发商OpenAI签署了一项价值逾百亿美元的协议,部署Cerebras芯片为其旗舰聊天机器人提供算力支持,OpenAI计划使用Cerebras芯片部署最高750兆瓦的算力。
这家初创公司背后汇聚了富达管理、Atreides Management、Benchmark、Tiger Global和Coatue等一线机构投资者的支持,但此前曾一度面临融资困难。
Cerebras曾于2024年9月提交IPO申请,但约一年后撤回了上市文件。上市计划何时重启,目前尚无定论。
相关攻略
OpenClaw的爆火,让众多AI应用开发者第一次直面了高昂的Token账单——一个用户请求可能触发多轮工具调用,每次调用都携带超长上下文,实际的API成本远超预期,甚至可能达到订阅费用的数十倍。如何有效控制Token成本,正成为AI Agent开发者面临的核心挑战与增长瓶颈。 这显然不是可持续的商
这项由瑞士洛桑联邦理工学院(EPFL)、意大利卢加诺大学(USI)、韦斯利安大学、巴黎脑研究所(ICM)以及宾夕法尼亚州立大学联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 03480。对这一交叉领域感兴趣的读者,可以通过该编号在arXiv平台上查阅完整原文。 一、
北京商报讯(记者 陶凤 王天逸) 人工智能领域又传来一条振奋人心的消息。4月8日,摩尔线程正式宣布,其旗舰级AI训推一体全功能GPU——MTT S5000,已经成功完成了对智谱新一代旗舰模型GLM-5 1的Day-0极速适配。这意味着,推理部署与训练复现的全部流程,现在都能在这条国产算力路径上获得支
如何用SQL求解逻辑推理题:经典楼层分配谜题实战 今天我们来探讨一个非常有趣的技术应用:使用SQL来求解逻辑推理题。这听起来或许有些大材小用,但正是这种跨界应用,充分展现了SQL语言的强大灵活性以及开发者分析问题的思维能力。我们将以一个经典的五人楼层分配谜题作为案例,逐步拆解如何用纯粹的SQL找到答
一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回
热门专题
热门推荐
峡谷区域唯一唱片需集齐三个碎片合成。首个碎片位于地图西北角木箱木桶旁,外观如跳动火焰。集齐碎片可解锁新内容并提升游戏体验,探索时留意细节可能发现更多隐藏惊喜。
《遥遥西土》中,西土唱片需集齐三个碎片合成。首个碎片位于地图东南角的管子洞内,获取过程简单,无复杂谜题或战斗。整体流程清晰,玩家按指引收集全部碎片即可合成唱片,轻松完成收集任务。
《鸣潮》联动《赛博朋克:边缘行者》,推出五星角色露西与丽贝卡,可通过限定卡池与活动免费获取。联动包含专属剧情、夜之城风格场景及高难度BOSS战,并植入动画经典音乐。参与预热活动和完成剧情任务可获得限定奖励,全方位打造沉浸式赛博朋克体验。
鼻噶流”玩法围绕“混沌爪牙”基因展开,开局以小体型角色灵活发育,注重走位与策略而非堆叠体型与伤害。该玩法在较高难度下提供了与传统平推思路不同的趣味体验,适合追求新鲜操作感的玩家尝试。
《异环》S级气态弧盘“好狗狗走四方”可提升充能与全队攻击,适合早雾等辅助。完成主线任务“成交?成交!”后解锁番外副本“月光当铺”,首次击败BOSS墨菲克斯即可免费获取。战斗时建议中距离拉扯,优先清理小狼,搭配破韧与输出角色更易通关。





