游乐游手机版
首页/科技数码/文章详情

英伟达定制AI推理芯片平台:融合Groq技术优化解码性能

时间:2026-02-28 15:25
英伟达将于下月在圣何塞举行的GTC开发者大会上正式推出一款面向OpenAI等头部客户的定制化人工智能处理器平台。该平台深度融合了初创企业Groq所研发的芯片技术,旨在显著提升人工智能工具的运行速度与

英伟达即将在下月于圣何塞举行的GTC开发者大会上,正式推出一款面向OpenAI等头部客户的定制化人工智能处理器平台。该平台深度融合了初创企业Groq研发的芯片技术,旨在显著提升人工智能工具的运算速度与能效水平。

OpenAI已确认将成为该处理器首批核心客户之一。近年来,OpenAI持续探索英伟达现有GPU架构之外的高效替代方案,并与多家芯片设计企业展开协同研发。为加速新平台落地,英伟达不仅获得了Groq多项关键技术的授权,还吸纳了其核心工程管理团队加入项目。

当前,人工智能应用正加速由模型训练阶段向大规模推理部署过渡,市场对高吞吐、低延迟、高能效比的推理专用芯片需求迅速攀升。尽管英伟达在训练领域保持技术领先,但其通用GPU在推理任务中,尤其在响应实时交互、处理长上下文等典型场景下,已显现出能效与延迟方面的结构性瓶颈。

新处理器系统聚焦于优化推理流程中最关键的两个环节——预填充与解码,其中解码阶段因涉及逐词生成与反复迭代,往往构成整体延迟的主要来源。此次架构升级将重点强化该环节的计算效率。此外,英伟达正同步拓展产品边界,首次以规模化方式推进纯CPU架构在人工智能推理场景中的部署,进一步覆盖多样化算力需求,强化在细分AI市场的综合竞争力。

来源:https://ai.zol.com.cn/1139/11396260.html
上一篇问界M7购车权益:最高优惠7万,享智能驾驶补贴与购置税减免 下一篇宝可梦30周年纪念卡牌全球发售:复刻经典与新款周边
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个