据智通财经APP获悉,广发证券发布的研报指出,RAG架构为大型语言模型提供了“长效记忆”能力,随着企业个性化应用与用户专属需求的日益增长,市场对RAG存储的需求也显著提升。在AI推理过程中,RAG向量数据库存储介质正经历从“内存参与检索”向“全SSD存储架构”的演进,这趋势将持续推动高带宽、大容量固态硬盘的需求增长。建议投资者关注产业链核心受益标的。
广发证券主要观点如下:
RAG为大模型提供“长期记忆”,企业级应用与个性化需求共同催化RAG存储需求攀升
在RAG(检索增强生成)架构中,大语言模型在生成最终答案前,会首先向向量数据库发起查询。向量数据库作为连接用户问题与外部知识库的关键枢纽,负责高效存储、管理和检索高维度的向量化知识表示,从而显著提升生成结果的准确性与时效性。从企业应用角度看,RAG正逐步渗透至在线场景(如电商、网页搜索)与离线场景(如企业内部知识库、法律文书分析、工程研究)。从个人应用层面看,个性化RAG能够保留用户长期的行为记忆、偏好习惯与上下文信息,形成专属的“用户级向量空间”,这极大地推动了RAG需求的增长。
AI推理推动RAG向量数据库发展,带动SSD需求增长
向量数据库存储介质需要承载海量向量数据及索引结构,必须支持高吞吐和低时延,以满足高并发场景下的快速向量相似度检索需求。目前,向量数据库存储介质正从“内存参与检索”逐步走向“全SSD存储架构”。根据《All-in-storage ANNS Algorithms Optimize VectorDB Usability within a RAG System》中以KIOXIA AiSAQ为例的研究,向量、PQ量化结果及索引统一存放于SSD中,规模达百亿级别的向量数据所需SSD总容量约为11.2TB,其中PQ向量占1.28TB,索引占10TB。在采用TLC/QLC SSD的情况下,AiSAQ相比基于DiskANN的架构具备4-7倍的成本优势。此外,AiSAQ架构中所有租户数据处于活跃就绪状态,查询请求可直接执行,无需经历先将数据从SSD加载至DRAM才能开始查询的“冷启动”延迟,从而提升了RAG系统的规模化扩展能力与经济可行性。
火山引擎TOS Vectors开启向量存储新模式,提升SSD需求预期
根据火山引擎开发者社区公众号信息,TOS推出Vector Bucket架构。该架构采用字节自研的云原生向量索引库Kiwi,并结合了多层级的本地缓存协同架构(覆盖DRAM、SSD与远程对象存储)。在数据规模巨大、存储周期长且查询频率相对较低的场景下,该架构不仅能满足高频与低频数据的分层存储需求,而且显著降低了企业大规模使用向量数据的技术与成本门槛。TOS Vectors与火山引擎高性能向量数据库、火山AI Agent等产品深度协同。以交互型Agent场景为例,将高频访问的记忆(如用户核心偏好、近期任务执行结果等)存放于向量数据库中,可实现毫秒级的高频检索;同时将低频访问的记忆(如数月前的交互记录或历史执行结果)沉淀至TOS Vectors中,允许秒级延迟,以此换取更低的存储成本和更广阔的存储空间。而在处理复杂任务的Agent场景中,TOS Vectors既能承载海量的语义向量存储,又能确保长期数据的可持续积累。
风险提示
AI产业发展以及相关需求不及预期;AI服务器出货量不及预期;国产厂商技术和产品进展不及预期。
