首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英伟达定制AI推理芯片平台:融合Groq技术优化解码性能

英伟达定制AI推理芯片平台:融合Groq技术优化解码性能

热心网友
20
转载
2026-02-28

英伟达即将在下月于圣何塞举行的GTC开发者大会上,正式推出一款面向OpenAI等头部客户的定制化人工智能处理器平台。该平台深度融合了初创企业Groq研发的芯片技术,旨在显著提升人工智能工具的运算速度与能效水平。

OpenAI已确认将成为该处理器首批核心客户之一。近年来,OpenAI持续探索英伟达现有GPU架构之外的高效替代方案,并与多家芯片设计企业展开协同研发。为加速新平台落地,英伟达不仅获得了Groq多项关键技术的授权,还吸纳了其核心工程管理团队加入项目。

当前,人工智能应用正加速由模型训练阶段向大规模推理部署过渡,市场对高吞吐、低延迟、高能效比的推理专用芯片需求迅速攀升。尽管英伟达在训练领域保持技术领先,但其通用GPU在推理任务中,尤其在响应实时交互、处理长上下文等典型场景下,已显现出能效与延迟方面的结构性瓶颈。

新处理器系统聚焦于优化推理流程中最关键的两个环节——预填充与解码,其中解码阶段因涉及逐词生成与反复迭代,往往构成整体延迟的主要来源。此次架构升级将重点强化该环节的计算效率。此外,英伟达正同步拓展产品边界,首次以规模化方式推进纯CPU架构在人工智能推理场景中的部署,进一步覆盖多样化算力需求,强化在细分AI市场的综合竞争力。

来源:https://ai.zol.com.cn/1139/11396260.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

DeepSeek API推理速度最快平台SophNet实测对比
AI教程
DeepSeek API推理速度最快平台SophNet实测对比

SophNet是什么 在人工智能应用竞争日趋激烈的今天,模型推理速度已成为衡量平台性能的核心指标,直接影响用户体验与商业效率。SophNet作为算能科技旗下的高性能云算力平台,正式推出其旗舰产品——DeepSeek满血极速版,为开发者提供行业领先的推理加速解决方案。 该版本最突出的优势在于其卓越的性

热心网友
05.23
东风汽车召回N7与N6车型近7万辆 油门踏板设计缺陷需警惕
业界动态
东风汽车召回N7与N6车型近7万辆 油门踏板设计缺陷需警惕

东风汽车召回近7万辆N6、N7车型。因油门踏板设计缺陷,长期使用后磨损可能导致踏板回位不畅,存在安全隐患。厂商将为召回车辆免费更换改进后的油门踏板总成,部分车型需同时更换制动踏板。

热心网友
05.23
极限竞速地平线6全26个摄影点位置与收集路线指南
游戏攻略
极限竞速地平线6全26个摄影点位置与收集路线指南

在《极限竞速:地平线6》的开放世界中,遍布全球的摄影地标不仅是玩家记录壮丽风景的绝佳地点,更是解锁游戏内丰厚奖励与成就的关键所在。游戏内总计设置了26个独特的摄影地标,将它们全部发现并拍摄下来,即可获得一份专属的惊喜奖励。如果你正在为寻找这些地标的具体位置而烦恼,这份详尽的摄影地标全收集攻略将为你提

热心网友
05.23
腾讯双轨智能体WorkBuddy与QClaw功能对比详解
AI资讯
腾讯双轨智能体WorkBuddy与QClaw功能对比详解

最近,腾讯在桌面AI智能体(Agent)领域动作频频,接连推出了两款引人注目的产品:WorkBuddy和QClaw。它们都瞄准了同一个核心痛点——用AI视觉模型识别并替代那些繁琐、重复的键鼠操作。但仔细一看,两者的定位和实现路径却截然不同,一个像是为企业量身定制的“协同中枢”,另一个则像是面向大众的

热心网友
05.23
Agent能否实现7x24小时无人值守自动化办公
AI资讯
Agent能否实现7x24小时无人值守自动化办公

当企业数字化转型步入深水区,对效率的追求已从单点自动化迈向构建全天候、全链路的智能化办公体系。7*24小时无人值守,不再是技术构想,而是全球数千家领先企业正在践行的业务常态。其核心引擎,是被称为“智能体(Agent)”的技术范式。它深度融合大语言模型与自动化能力,将传统数字员工从被动执行的工具,升级

热心网友
05.23