英伟达GTC大会前瞻:AI霸主能否守住江山,聚焦后训练时代新战略
据智通财经APP了解,一年一度的英伟达GTC开发者大会即将于下周拉开帷幕。这场被誉为“AI领域年度风向标”的盛会,其热度与重要性在今年更上层楼。当公司首席执行官黄仁勋下周一(当地时间3月16日)走进座无虚席的冰球场时,全球投资者的目光都将聚焦于他手中将要打出的王牌,以应对日益激烈的市场竞争,并巩固其作为人工智能芯片领导者的地位。
此次为期四天的GTC大会,不仅是英伟达展示其在芯片、数据中心、软件平台CUDA、AI代理以及机器人等物理AI领域最新进展的舞台,更是一场对公司战略方向的关键检验。在此前交出超预期财报却未能带动股价明显上涨后,投资者渴望得到保证:英伟达利用反AI生态的战略正在见效。
市场研究机构eMarketer分析师Jacob Bourne表示:“我预计英伟达将展示从Rubin到Feynman的全栈路线图更新,同时重点强调推理、智能体AI、网络技术和AI工厂基础设施。”
“后训练时代”的竞争焦点:推理芯片
随着AI行业从大模型的“训练”阶段,加速向AI代理在应用中穿插执行任务的“推理”阶段过渡,市场的竞争格局正在发生深刻变化。尽管英伟达目前在训练和推理市场仍占据超过90%的份额,但分析师普遍认为,其市场份额的流失将在所难免,尤其是在推理领域。
推理芯片初创公司d-Matrix的创始人兼首席执行官Sid Sheth表示,虽然英伟达在训练领域仍将保持主导地位,但“推理完全是另一回事”。他补充道,CUDA作为英伟达支撑大多数AI训练并将开发者锁定在其生态系统的核心软件,在推理领域的“护城河”作用较弱。开发者可以转向英伟达之外的竞争对手,因为运行已完成的AI模型并不需要像训练它们那样进行复杂的编程。
为了应对这一趋势,英伟达预计将在大会上推出专为推理工作负载优化的新产品。有报道称,一款融合了去年12月以17亿美元收购的AI初创公司Groq技术的推理芯片有望亮相,旨在提供快速且成本效益高的推理计算能力。Groq的超快AI技术将被整合进英伟达庞大的CUDA生态中,以此巩固其软件护城河。
潜在威胁与英伟达的“防御工事”
然而,挑战依然严峻。一方面,包括OpenAI和Meta在内的英伟达核心大客户均已启动自研芯片,Meta更是明确将每半年发布一款全新AI芯片。专用集成电路的崛起被视为对英伟达通用图形处理器的长期威胁,这类为特定功能定制的芯片在推理场景展现出更高的效率优势。
Summit Insights Group董事总经理KinNgai Chan表示,相比一年前,英伟达无疑将面临更激烈的市场竞争,预计到2027年,随着企业自研ASIC芯片实现规模化落地,英伟达的市场份额将出现下滑,尤其是在推理芯片市场。
为应对挑战,英伟达正多管齐下加强防御。除了收购Groq,公司近期还向光通信公司Lumentum和Coherent分别投资了20亿美元,旨在推动“共封装光学”技术的应用。该技术利用光而非电信号在芯片间传输数据,有望大幅提升超大规模数据中心的连接效率并降低功耗。William Blair研究分析师Sebastien Naji预计,CPO将是下一代Feynman芯片架构的核心突破方向。
eMarketer的Bourne补充道,英伟达很可能在GTC上将CPO技术定位为高效连接大规模AI集群的关键,不过,目前该技术的量产规模仍无法匹配英伟达芯片的出货量,其规模化部署的成本与可行性,也将是投资者关注的重点。
另一方面,由英特尔和AMD长期主导的中央处理器在AI任务中的地位正在回升。Third Bridge分析师指出,随着代理AI的兴起,由CPU负责的“代理编排层”正成为新的性能瓶颈。因此,该分析师预计,英伟达将展示仅使用其CPU的服务器产品,以回应这一新趋势。
AI代理与机器人:驱动下一波增长浪潮
除了硬件层面的竞争,市场同样关注AI应用的前景能否支撑起持续的计算力需求。黄仁勋此前强调,智能体AI将成为推理需求的下一个重要驱动力。d-Matrix的Sheth表示,随着语音、视频和多模态AI代理的潜力逐步释放,这一领域有望带来新一轮的推理计算浪潮。
机器人技术则被视为另一层增长空间。The Futurum Group首席执行官Daniel Newman指出,英伟达上一季度已报告约60亿美元的机器人相关收入,并预测人形机器人的发展时间表将非常“激进”。这预示着物理AI可能比预期更快地成为现实。
地缘政治:悬在芯片巨头头顶的达摩克利斯之剑
在技术竞争之外,地缘政治因素正日益成为影响英伟达未来的关键变量。随着美国考虑进一步扩大对AI芯片的出口限制,以及中国等关键市场的准入受限,英伟达的全球销售版图正在重塑。据报道,在中国市场彻底遇冷后,英伟达已停止生产H200芯片,并将产能转移至下一代Rubin平台。
在此背景下,中东地区如沙特和阿联酋等国的大规模AI基础设施投资,对英伟达而言意义重大。然而,地区冲突、能源成本以及数据中心建设速度等因素,都为这些新兴市场的需求增添了不确定性。
相关攻略
时间来到2026年中,关于索尼下一代游戏主机PlayStation 6的轮廓,正从各种行业传闻中变得日益清晰。 根据TCMF2及多家权威行业分析报告显示,PS6的核心定制芯片(APU)已于今年1月完成了首次流片。这枚芯片堪称未来主机的“性能心脏”。回顾索尼PlayStation系列主机的硬件开发历史
北京君正近日在投资者互动平台披露,其计算芯片产品已成功集成自主研发的CPU核心与NPU模块,该技术方案目前已在市场实现规模化落地应用。 这一信息明确了北京君正的核心技术战略:坚持关键IP的自研道路。在计算芯片领域,掌握自主的CPU与NPU架构,意味着企业在产品定义、性能调优与供应链安全方面获得了更高
科技股的热度,丝毫没有降温的迹象。 北京时间11日晚间,美股市场再次上演了熟悉的一幕:芯片股集体发力,费城半导体指数盘中一度飙升超过2%。英伟达、美光科技、高通、英特尔、AMD这些耳熟能详的名字,股价齐齐创下历史新高。与此同时,光通信板块也表现强劲,Lumentum涨幅超过10%,康宁涨超7%。市场
5月12日,理想汽车创始人兼CEO李想通过其个人社交平台正式官宣,发布了公司自主研发的AI芯片——马赫M100。这一动作标志着理想汽车在智能驾驶核心硬件领域迈出了关键一步。 李想在分享中指出,当前主流的车载芯片设计大多仍基于传统的冯·诺依曼架构。然而,随着人工智能时代的全面到来,海量的非结构化数据处
近日,云天励飞在最新披露的投资者交流纪要中,系统阐述了其面向下一代人工智能的推理芯片研发蓝图。该芯片的核心创新围绕其自主研发的GPNPU架构展开,旨在从底层系统性破解当前大模型在推理部署中普遍面临的效率瓶颈与高昂成本难题。其技术战略主要聚焦于四大关键维度。 一、GPGPU级通用编程能力:破解“易用性
热门专题
热门推荐
在流量日益分散的今天,把鸡蛋放在同一个篮子里,风险不言而喻。多平台推广,早已不是“要不要做”的选择题,而是“如何做好”的生存题。它的核心价值,可以概括为两点:实现“流量风险对冲”,以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵,企业不仅能有效缓冲单一
DeepSeek知识库的核心,是运用RAG(检索增强生成)技术,将DeepSeek强大的大语言模型推理能力,与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程(SOP)等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答,让AI的回答不再是通用泛化,而是具备专业依据、内容详
三大运营商推出Token套餐,将大模型调用量包装为类似流量包的产品,以降低AI使用门槛。中国电信推出个人与企业多档套餐,最低月费9 9元;上海移动推出1元购40万Tokens服务;联通则提供个人与团队版套餐。运营商凭借用户渠道和支付优势,推动算力消费向大众市场普及,可能重塑AI服务消费模式。
HermesAgent本地运行缓慢常因未量化的大语言模型占用资源过多。可通过AWQ量化模型、llama cpp后端加载GGUF模型、配置vLLM引擎提升并发吞吐、禁用非必要工具降低上下文开销,以及调整SQLite记忆检索阈值等方案优化。这些方法能显著降低延迟,提升响应速度。
随着AI智能体能力的持续增强,确保其行为始终符合预设目标与安全边界,已成为行业亟待解决的核心挑战。然而,当前主流的治理方案在防止智能体“失控”或“脱轨”方面,仍面临显著的实践瓶颈。 在之前的探讨中,我们分析了主流治理思路:部署多样化的对抗性验证器,构建一个多层次的安全审查网络。该方案的核心逻辑并非限





