广发证券：RAG推理驱动SSD需求，关注产业链核心标的

时间：2025-12-31 11:01

智通财经APP获悉，广发证券发布研报称，RAG架构为大模型提供长期记忆，企业和个性化需求推动了对RAG存储需求的增长。AI推理中的RAG向量数据库存储介质正在从“内存参与检索”向“全SSD存储架构”

据智通财经APP获悉，广发证券发布的研报指出，RAG架构为大型语言模型提供了“长效记忆”能力，随着企业个性化应用与用户专属需求的日益增长，市场对RAG存储的需求也显著提升。在AI推理过程中，RAG向量数据库存储介质正经历从“内存参与检索”向“全SSD存储架构”的演进，这趋势将持续推动高带宽、大容量固态硬盘的需求增长。建议投资者关注产业链核心受益标的。

广发证券主要观点如下：

RAG为大模型提供“长期记忆”，企业级应用与个性化需求共同催化RAG存储需求攀升

在RAG（检索增强生成）架构中，大语言模型在生成最终答案前，会首先向向量数据库发起查询。向量数据库作为连接用户问题与外部知识库的关键枢纽，负责高效存储、管理和检索高维度的向量化知识表示，从而显著提升生成结果的准确性与时效性。从企业应用角度看，RAG正逐步渗透至在线场景（如电商、网页搜索）与离线场景（如企业内部知识库、法律文书分析、工程研究）。从个人应用层面看，个性化RAG能够保留用户长期的行为记忆、偏好习惯与上下文信息，形成专属的“用户级向量空间”，这极大地推动了RAG需求的增长。

AI推理推动RAG向量数据库发展，带动SSD需求增长

向量数据库存储介质需要承载海量向量数据及索引结构，必须支持高吞吐和低时延，以满足高并发场景下的快速向量相似度检索需求。目前，向量数据库存储介质正从“内存参与检索”逐步走向“全SSD存储架构”。根据《All-in-storage ANNS Algorithms Optimize VectorDB Usability within a RAG System》中以KIOXIA AiSAQ为例的研究，向量、PQ量化结果及索引统一存放于SSD中，规模达百亿级别的向量数据所需SSD总容量约为11.2TB，其中PQ向量占1.28TB，索引占10TB。在采用TLC/QLC SSD的情况下，AiSAQ相比基于DiskANN的架构具备4-7倍的成本优势。此外，AiSAQ架构中所有租户数据处于活跃就绪状态，查询请求可直接执行，无需经历先将数据从SSD加载至DRAM才能开始查询的“冷启动”延迟，从而提升了RAG系统的规模化扩展能力与经济可行性。

火山引擎TOS Vectors开启向量存储新模式，提升SSD需求预期

根据火山引擎开发者社区公众号信息，TOS推出Vector Bucket架构。该架构采用字节自研的云原生向量索引库Kiwi，并结合了多层级的本地缓存协同架构（覆盖DRAM、SSD与远程对象存储）。在数据规模巨大、存储周期长且查询频率相对较低的场景下，该架构不仅能满足高频与低频数据的分层存储需求，而且显著降低了企业大规模使用向量数据的技术与成本门槛。TOS Vectors与火山引擎高性能向量数据库、火山AI Agent等产品深度协同。以交互型Agent场景为例，将高频访问的记忆（如用户核心偏好、近期任务执行结果等）存放于向量数据库中，可实现毫秒级的高频检索；同时将低频访问的记忆（如数月前的交互记录或历史执行结果）沉淀至TOS Vectors中，允许秒级延迟，以此换取更低的存储成本和更广阔的存储空间。而在处理复杂任务的Agent场景中，TOS Vectors既能承载海量的语义向量存储，又能确保长期数据的可持续积累。

风险提示

AI产业发展以及相关需求不及预期；AI服务器出货量不及预期；国产厂商技术和产品进展不及预期。

来源：https://www.163.com/dy/article/KI3LLD6705198UNI.html

向量索引 ssd rag 产业链广发证券正式版模型

上一篇标普预警：2026美国车市或下行，轻型车销量恐下滑2.5% 下一篇京东承接全民补贴；曹操出行拟全资收购耀出行与吉利商旅

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5

科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起，两项关乎电动汽车安全的核心强制性国家标准将正式实施，为行业加装“安全锁”——《电动汽车安全要求》（GB 18384-2025）与《电动汽车用动力蓄电池安全要求》（GB 38031-2025）同步落地。此次标准升级，从整车架构与电池系统两大维度，精准填补了近年来多起事故暴露出的