英伟达押注AI推理:计算变革迎来重大突破

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
图1:黄仁勋开始发力推理芯片
北京时间3月17日,《华尔街日报》报道称,AI领域正在经历一场重大变革,这对大大小小的科技公司都影响深远。
过去五年间,AI领域的主要焦点一直是大语言模型的训练。这是一个成本高昂的过程,需要数万块芯片、消耗巨大的能源,且在偏远的大型数据中心进行。这一训练过程需要使用数千个专业微处理器芯片组成的集群,将数百亿条信息输入模型。芯片集群每周7天、每天24小时运行,持续数周甚至数月之久。
从训练到推理
如今,随着越来越多的公司部署AI智能体,并试图将基于大语言模型构建的新工具商业化,焦点已转向推理:这种计算方式能让训练好的AI模型响应用户的查询。
根据研究机构Gartner的数据,今年全球在推理基础设施上的资本支出,预计将首次超过训练资本支出。到2029年,企业在推理上的投入将达到720亿美元,是训练投入370亿美元的近两倍。

推理支出将超过训练
这一转变意味着,科技公司购买的芯片类型将发生重大变化。英伟达之所以成为全球市值最高的公司,靠的是销售名为GPU的芯片,这类芯片具备模型训练所需的原始处理能力。但乔治城大学研究AI的学者雅各布·菲尔德戈伊斯表示,那些预期将进行更多推理工作的公司,可以通过使用专门为推理任务优化的芯片来获得性能提升。
专门生产推理芯片的制造商包括谷歌、Cerebras Systems、SambaNova等,他们正以越来越快的速度签下价值数十亿美元的订单。英伟达则准备推出自己的推理专用处理器,此前该公司于去年12月斥资200亿美元,获得了定制推理芯片公司Groq的技术授权并吸纳其顶尖人才。
那么,究竟什么是推理计算?它与训练所需的计算有何不同?为什么需求如此迅速转向推理?这对市场又意味着什么?
推理计算的原理
你可以把AI想象成一家餐厅。模型就是那位厨师。在经过一段时间的密集培训,学习了数百乃至数十亿个食谱和烹饪技巧后,它就可以开始接单了。
推理就是这家餐厅的日常运营。食客下单,厨师备餐。

推理的原理
推理包含两个阶段,即预填充和解码。当用户输入提示词时,预填充阶段开始,模型通过处理其中的每个单词、符号或图像来解读用户的查询。
解码则是模型运用其在训练中学到的一切,生成查询响应的过程。
推理的这两个阶段对芯片有着不同的要求:预填充阶段需要更强的处理能力,而解码阶段则需要更大的内存,部分原因在于它必须调动所积累的全部知识,才能为用户呈上新鲜出炉的"词元"。
什么是词元?
词元是用于处理查询并生成响应的基本数据单位。
虽然不同类型的数据对应的换算范围有所不同,但通常认为一个词元大约相当于四分之三个英文单词。以"今天天气怎么样?"这样简单的聊天机器人查询为例,模型会将其解析为六到八个词元。

词元
模型通常逐次生成一个词元,并且必须按正确的顺序输出每个词元,这样才能保证回答通顺合理。
目前,那些试图将AI工具变现的公司,从会计软件、旅行预订服务到图像生成器,都痴迷于诸如"每瓦每秒生成的词元数"或"每美元每秒生成的词元数"这类成本指标。
芯片制造商格芯的CEO蒂姆·布林表示,这使得推理芯片高效输出结果的能力变得尤为重要,"如今,降低推理成本才是关键所在"。
训练与推理芯片的区别
由于训练需要在长时间内处理海量数据,所采用的芯片必须具备强大的处理能力,且芯片所在的数据中心必须能够获得充足的能源以及用于冷却芯片的水。训练同样需要内存,但如果GPU内存不足,可以将部分处理任务分派给其他芯片,或者等待现有内存释放。
相比之下,推理过程是按需进行的,耗时以秒计,而非数周。"超过十秒钟,用户就已经开始用大拇指敲手机屏幕,准备去做下一件事了。"芯片设计公司SambaNova的CEO罗德里戈·梁表示。
因此,推理芯片必须配备更大容量的高带宽内存,且其所在的数据中心必须邻近用户聚集区以降低延迟。像Ayar Labs这样的芯片创业公司也越来越多地采用光纤连接组件,光纤的数据传输速度比铜缆更快,且所需冷却更少。
Ayar Labs CEO马克·韦德表示:"如今,一切都围绕着推理规模化展开。"
更多一手新闻,欢迎下载凤凰新闻客户端订阅科技。想看深度报道,请微信搜索"科技"。
相关攻略
芯片股行情持续火爆,市场热度不减。 当地时间5月11日(周一),美股市场情绪积极,三大指数集体收高。其中,标普500指数与纳斯达克综合指数均创下历史收盘新高。具体数据显示,道琼斯工业平均指数上涨0 19%,标普500指数上涨0 19%,纳斯达克综合指数微涨0 1%。 大型科技股走势出现分化。特斯拉领
中微半导正式推出自主研发的32MbitSPINORFlash芯片,丰富了其存储产品线。但该产品尚未销售,市场推广效果待观察。NORFlash市场规模有限且竞争激烈,公司可能面临价格压力。此外,资源投入需平衡,存储行业的周期性也带来了市场表现与营收波动的风险。
半导体行业最近又传来一个重磅消息。英国芯片设计巨头Arm宣布,其首款自主研发的人工智能芯片,预计在明年就能斩获高达20亿美元的销售额。这个数字背后,是市场对这款产品近乎“抢购”般的强烈需求,也清晰地标志着,这家以IP授权闻名的公司,正在AI硬件赛道上迈出关键一步。 时机选得恰到好处。眼下,从云计算到
多位车企负责人指出,汽车并非快消品。汽车生命周期长、价值高,涉及家庭重大开支,消费者重视保值与长期成本。车辆需保障生命安全,必须经过严苛的实车测试与车规级认证,其芯片等零部件需耐受极端环境,缺陷率要求极低。硬件迭代受限于漫长研发周期,难以像消费电子产品般快速更新。
荷兰研究团队在量子点芯片上成功实现了单电子自旋量子比特在不同量子点间的转移,并完成了双量子比特门操作与纠缠验证,甚至演示了量子隐形传态。该实验突破了量子点间连接固定的限制,保真度表现良好,为构建灵活、可扩展的量子处理器提供了新思路。
热门专题
热门推荐
主流币与山寨币在市值、技术、共识和风险上差异显著。主流币市值巨大、流动性强,技术经过长期验证,拥有全球共识和明确应用场景,适合长期配置。山寨币则市值小、流动性差,技术基础薄弱且缺乏审计,共识脆弱且多依赖炒作,价格波动剧烈且归零风险高,属于高风险投机标的。
进行Bitget身份认证时,除了正确上传照片,证件本身的清晰度至关重要。模糊、反光或信息不全的图片会直接导致审核失败。此外,认证申请提交后的等待时间受平台审核队列、资料完整度及网络状况等多重因素影响,高峰期可能延长。建议用户确保在光线均匀环境下拍摄高清证件照,并耐心等待系统处理,以提升一次性通过率。
本文详细介绍了Bitget交易所在不同设备上的下载与访问方法。安卓用户可通过官方应用商店或APK文件安装,需注意权限设置。iPhone用户需切换至非中国大陆AppStore账户下载官方App。网页端则提供最直接的访问方式,无需安装,但务必核对网址安全性。文章还补充了常见问题与安全建议,帮助用户顺利完成平台使用前的准备工作。
对于初次接触Bitget的新用户,从注册到完成第一笔交易,平台提供了一条清晰的操作路径。关键在于完成账户注册与安全设置,包括身份验证和资金密码。随后,通过法币入金通道为账户注入启动资金,并熟悉现货交易界面的基本操作。最后,在模拟交易中实践后,即可尝试小额真实交易,完成从入门到实操的完整闭环。
对于初次接触Bitget这类专业交易平台的新用户来说,感到无从下手是普遍现象。关键在于熟悉核心功能区的布局,特别是资产总览、现货交易、合约交易、资金划转、订单管理和个人设置这六个关键页面。掌握它们的位置和基本逻辑,就能快速理清平台操作脉络,大幅提升使用效率,避免在基础操作上耗费过多时间。





