游乐游手机版
首页/科技数码/文章详情

广发证券:AI上游基础设施价值提升,关注产业链核心标的

时间:2026-02-03 14:55
智通财经APP获悉,广发证券发布研报称,AI的Memory时刻,AI记忆成为支撑上下文连续性、个性化与历史信息复用的底层能力,持续扩展模型能力边界,有望促进AI Agent等应用加速落地。AI记忆的

智通财经APP获悉,广发证券近日发布研究报告指出,AI的记忆能力已成为实现上下文连续性、个性化体验及历史信息复用的核心技术支柱。通过不断扩展模型的能力边界,有望加速推动AI智能体等应用场景的落地进程。AI记忆的价值正从一项“成本项”转变为“资产项”,其上游基础设施的价值量与重要性将持续提升。建议关注产业链中核心受益的相关标的。

广发证券的主要观点如下:

英伟达推出AI推理上下文存储平台ICMS

随着用户多轮对话与智能体持续运行带来的KVCache数据不断累积,系统对需长期留存并可随时调取的分层缓存数据产生了刚性需求,推动了上下文数据从HBM存储向DRAM、SSD等分层介质迁移。为此,英伟达推出了上下文记忆存储架构ICMS,面向智能体与多轮推理场景提供“长期上下文记忆层”。该架构一方面能够承载更大规模的KVCache,另一方面能以低延迟将历史对话中的KVCache数据回溯到多个GPU节点,以支持多轮次推理会话。其KV访问模式呈现出类似TFT约束下的高并发、高吞吐随机读取特征。

ICMS平台对SSD使用效果显著

在经济性与扩展性方面,SSD的单位成本显著低于GPU内存,且可按TB、PB级容量灵活扩展,是承载长期上下文数据的天然介质。在可行性方面,据相关行业报告分析,ICMS引入PB级存储层后,其访问延迟仅略高于缓存化的DRAM。在实证方面,WEKA对其增强型内存网格解决方案(AMG)进行了性能评估。AMG是一种与英伟达ICMS兼容的上下文存储方案。测试在解码阶段模拟了持续扩张的用户场景池:初期用户池较小时,KVCache基本驻留在GPU的HBM内,三种方案均能维持较高的Token吞吐量;但随着用户数持续增长,KVCache会外溢至更低层级的内存或存储介质,此时Token吞吐量开始下降。然而,WEKA AMG凭借更高的容量、更强的网络与高并发随机访问能力,能够更快地完成上下文数据的预取与回填,有效减少冷启动与阻塞现象,从而在用户池显著扩大后,仍能保持更高且更稳定的Token吞吐性能。相比其他两种传统方案,其吞吐量提升最高可达4倍,验证了ICMS架构能够有效承接长期上下文并维持系统吞吐稳定性。

ICMS平台打开存储市场空间

参考行业数据,该行对上下文存储空间需求进行了测算。单个Token所需存储空间约为504KB。若每个用户的上下文窗口为64000 Tokens,则对应存储需求约为30GB。考虑到提升用户体验,假设留存倍数为15倍。在上述假设下,支持10万规模用户/智能体的总存储需求约为45PB。这意味着,若要在具备强大对话历史记忆能力的大上下文模型上稳定支持10万量级的并发用户或智能体,所需的上下文存储规模将达到PB级别。

风险提示

AI产业发展以及市场需求不及预期;AI服务器出货量不及预期;国产厂商技术和产品进展不及预期。

来源:https://www.163.com/dy/article/KKRM97MJ05198UNI.html
上一篇SpaceX星链联手xAI,未来将部署百万卫星网络 下一篇OpenAI进军游戏业:用一句话生成整款游戏
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5