首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
亚马逊部署Cerebras芯片方案,极速推理驱动AI变革

亚马逊部署Cerebras芯片方案,极速推理驱动AI变革

热心网友
58
转载
2026-03-14

亚马逊云服务与芯片初创公司Cerebras宣布达成多年合作协议,将在其数据中心部署Cerebras芯片,用于AI推理计算。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

3月13日周五,根据双方公布的协议,亚马逊云服务将把Cerebras芯片与自研Trainium芯片组合部署,以提供更高速的推理计算服务。

这也是继今年1月OpenAI与Cerebras签署逾百亿美元合作协议之后,这家初创公司再度获得大型科技巨头背书。

Cerebras将其芯片标榜为"极速推理解决方案",并表示它们可以处理被称为"解码"的复杂任务,即推理计算阶段,人工智能模型在此阶段对用户查询做出响应,速度比英伟达的GPU快25倍。

此次合作对Cerebras的商业版图具有重要意义。Cerebras首席执行官Andrew Feldman表示:

越来越多人开始使用人工智能,使用频率也越来越高,并且用它来解决更复杂的问题。这使得Cerebras-Trainium解决方案能够接入最大的云平台,让我们有机会接触到大量的客户。

推理市场崛起,GPU主导地位受压

AI行业算力需求的重心正悄然转移。

随着AI工具和智能体的用户规模迅速扩张,训练阶段的算力需求趋于饱和,推理计算的重要性日益凸显。企业普遍认识到,GPU虽在模型训练中表现出色,但在要求极致响应速度的推理工作负载上并非最优选择,这促使各方加快多元化供应商布局。

AWS作为全球最大的云服务提供商,此前主要依赖旗下Annapurna Labs半导体业务设计的Trainium芯片为数据中心提供算力支持。

此次引入Cerebras芯片,意在弥补Trainium在高速推理场景下的局限,并在推理产品线上提供分层定价方案,速度较慢的纯Trainium服务将以更低价格提供,而Cerebras与Trainium的组合方案则定位高端。

AWS联合创始人、副总裁Nafea Bshara表示,该公司的目标是"持续推进速度提升并降低价格"。Feldman则直言:

如果你希望获得快速token输出,如果速度对你至关重要,如果你在从事代码或智能体工作,我们不仅是绝对最快的,而且我们意在设定行业标准。

英伟达压力加剧,定制芯片势力扩张

这笔交易是英伟达面临日益激烈竞争的缩影。

定制处理器设计商正以专项场景突破的方式蚕食英伟达的市场份额,客户对更快速度和更低成本的诉求也在倒逼芯片巨头加速产品迭代。

据报道,英伟达去年12月与芯片初创公司Groq签署了一项价值200亿美元的授权协议,并计划于近期发布采用Groq技术、专门面向推理场景的新型处理系统。

对Cerebras而言,与AWS的合作发生在其业务高速扩张的关键节点。

今年2月,Cerebras宣布完成10亿美元新一轮融资,累计融资总额升至26亿美元,投后估值约为230亿美元。

今年1月,ChatGPT开发商OpenAI签署了一项价值逾百亿美元的协议,部署Cerebras芯片为其旗舰聊天机器人提供算力支持,OpenAI计划使用Cerebras芯片部署最高750兆瓦的算力。

这家初创公司背后汇聚了富达管理、Atreides Management、Benchmark、Tiger Global和Coatue等一线机构投资者的支持,但此前曾一度面临融资困难。

Cerebras曾于2024年9月提交IPO申请,但约一年后撤回了上市文件。上市计划何时重启,目前尚无定论。

来源:https://www.163.com/dy/article/KNVRTRKI05198NMR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

搜索成本仅为推理十分之一却鲜为人知的行业真相
科技数码
搜索成本仅为推理十分之一却鲜为人知的行业真相

OpenClaw的爆火,让众多AI应用开发者第一次直面了高昂的Token账单——一个用户请求可能触发多轮工具调用,每次调用都携带超长上下文,实际的API成本远超预期,甚至可能达到订阅费用的数十倍。如何有效控制Token成本,正成为AI Agent开发者面临的核心挑战与增长瓶颈。 这显然不是可持续的商

热心网友
05.12
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步
科技数码
EPFL等机构发现大语言模型的内部思维与人类创造性大脑高度同步

这项由瑞士洛桑联邦理工学院(EPFL)、意大利卢加诺大学(USI)、韦斯利安大学、巴黎脑研究所(ICM)以及宾夕法尼亚州立大学联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 03480。对这一交叉领域感兴趣的读者,可以通过该编号在arXiv平台上查阅完整原文。 一、

热心网友
04.22
摩尔线程完成智谱GLM-5.1适配
科技数码
摩尔线程完成智谱GLM-5.1适配

北京商报讯(记者 陶凤 王天逸) 人工智能领域又传来一条振奋人心的消息。4月8日,摩尔线程正式宣布,其旗舰级AI训推一体全功能GPU——MTT S5000,已经成功完成了对智谱新一代旗舰模型GLM-5 1的Day-0极速适配。这意味着,推理部署与训练复现的全部流程,现在都能在这条国产算力路径上获得支

热心网友
04.15
如何利用SQL进行推理
数据库
如何利用SQL进行推理

如何用SQL求解逻辑推理题:经典楼层分配谜题实战 今天我们来探讨一个非常有趣的技术应用:使用SQL来求解逻辑推理题。这听起来或许有些大材小用,但正是这种跨界应用,充分展现了SQL语言的强大灵活性以及开发者分析问题的思维能力。我们将以一个经典的五人楼层分配谜题作为案例,逐步拆解如何用纯粹的SQL找到答

热心网友
04.14
AI看图能力真伪探秘:它是否真是编出来的?
科技数码
AI看图能力真伪探秘:它是否真是编出来的?

一个学生忽视了一行代码,结果发现了一件很不对劲的事:在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。按理说系统应该报错,或者至少拒绝回

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

峡谷唱片碎片全收集攻略 西土地区唱片位置详解
游戏攻略
峡谷唱片碎片全收集攻略 西土地区唱片位置详解

峡谷区域唯一唱片需集齐三个碎片合成。首个碎片位于地图西北角木箱木桶旁,外观如跳动火焰。集齐碎片可解锁新内容并提升游戏体验,探索时留意细节可能发现更多隐藏惊喜。

热心网友
05.12
西土唱片碎片收集攻略与获取方法详解
游戏攻略
西土唱片碎片收集攻略与获取方法详解

《遥遥西土》中,西土唱片需集齐三个碎片合成。首个碎片位于地图东南角的管子洞内,获取过程简单,无复杂谜题或战斗。整体流程清晰,玩家按指引收集全部碎片即可合成唱片,轻松完成收集任务。

热心网友
05.12
鸣潮联动赛博朋克边缘行者新角色副本上线
游戏攻略
鸣潮联动赛博朋克边缘行者新角色副本上线

《鸣潮》联动《赛博朋克:边缘行者》,推出五星角色露西与丽贝卡,可通过限定卡池与活动免费获取。联动包含专属剧情、夜之城风格场景及高难度BOSS战,并植入动画经典音乐。参与预热活动和完成剧情任务可获得限定奖励,全方位打造沉浸式赛博朋克体验。

热心网友
05.12
万物皆可蟹进化攻略:混沌爪牙基因与鼻噶流玩法解析
游戏攻略
万物皆可蟹进化攻略:混沌爪牙基因与鼻噶流玩法解析

鼻噶流”玩法围绕“混沌爪牙”基因展开,开局以小体型角色灵活发育,注重走位与策略而非堆叠体型与伤害。该玩法在较高难度下提供了与传统平推思路不同的趣味体验,适合追求新鲜操作感的玩家尝试。

热心网友
05.12
异环S级气态弧盘获取攻略 好狗狗走四方任务详解
游戏攻略
异环S级气态弧盘获取攻略 好狗狗走四方任务详解

《异环》S级气态弧盘“好狗狗走四方”可提升充能与全队攻击,适合早雾等辅助。完成主线任务“成交?成交!”后解锁番外副本“月光当铺”,首次击败BOSS墨菲克斯即可免费获取。战斗时建议中距离拉扯,优先清理小狼,搭配破韧与输出角色更易通关。

热心网友
05.12