广发证券:RAG推理驱动SSD需求,关注产业链核心标的
据智通财经APP获悉,广发证券发布的研报指出,RAG架构为大型语言模型提供了“长效记忆”能力,随着企业个性化应用与用户专属需求的日益增长,市场对RAG存储的需求也显著提升。在AI推理过程中,RAG向量数据库存储介质正经历从“内存参与检索”向“全SSD存储架构”的演进,这趋势将持续推动高带宽、大容量固态硬盘的需求增长。建议投资者关注产业链核心受益标的。
广发证券主要观点如下:
RAG为大模型提供“长期记忆”,企业级应用与个性化需求共同催化RAG存储需求攀升
在RAG(检索增强生成)架构中,大语言模型在生成最终答案前,会首先向向量数据库发起查询。向量数据库作为连接用户问题与外部知识库的关键枢纽,负责高效存储、管理和检索高维度的向量化知识表示,从而显著提升生成结果的准确性与时效性。从企业应用角度看,RAG正逐步渗透至在线场景(如电商、网页搜索)与离线场景(如企业内部知识库、法律文书分析、工程研究)。从个人应用层面看,个性化RAG能够保留用户长期的行为记忆、偏好习惯与上下文信息,形成专属的“用户级向量空间”,这极大地推动了RAG需求的增长。
AI推理推动RAG向量数据库发展,带动SSD需求增长
向量数据库存储介质需要承载海量向量数据及索引结构,必须支持高吞吐和低时延,以满足高并发场景下的快速向量相似度检索需求。目前,向量数据库存储介质正从“内存参与检索”逐步走向“全SSD存储架构”。根据《All-in-storage ANNS Algorithms Optimize VectorDB Usability within a RAG System》中以KIOXIA AiSAQ为例的研究,向量、PQ量化结果及索引统一存放于SSD中,规模达百亿级别的向量数据所需SSD总容量约为11.2TB,其中PQ向量占1.28TB,索引占10TB。在采用TLC/QLC SSD的情况下,AiSAQ相比基于DiskANN的架构具备4-7倍的成本优势。此外,AiSAQ架构中所有租户数据处于活跃就绪状态,查询请求可直接执行,无需经历先将数据从SSD加载至DRAM才能开始查询的“冷启动”延迟,从而提升了RAG系统的规模化扩展能力与经济可行性。
火山引擎TOS Vectors开启向量存储新模式,提升SSD需求预期
根据火山引擎开发者社区公众号信息,TOS推出Vector Bucket架构。该架构采用字节自研的云原生向量索引库Kiwi,并结合了多层级的本地缓存协同架构(覆盖DRAM、SSD与远程对象存储)。在数据规模巨大、存储周期长且查询频率相对较低的场景下,该架构不仅能满足高频与低频数据的分层存储需求,而且显著降低了企业大规模使用向量数据的技术与成本门槛。TOS Vectors与火山引擎高性能向量数据库、火山AI Agent等产品深度协同。以交互型Agent场景为例,将高频访问的记忆(如用户核心偏好、近期任务执行结果等)存放于向量数据库中,可实现毫秒级的高频检索;同时将低频访问的记忆(如数月前的交互记录或历史执行结果)沉淀至TOS Vectors中,允许秒级延迟,以此换取更低的存储成本和更广阔的存储空间。而在处理复杂任务的Agent场景中,TOS Vectors既能承载海量的语义向量存储,又能确保长期数据的可持续积累。
风险提示
AI产业发展以及相关需求不及预期;AI服务器出货量不及预期;国产厂商技术和产品进展不及预期。
相关攻略
在追求更高算力与能效的赛道上,RISC-V阵营迎来了一位实力强劲的新成员。美国当地时间5月12日,知名RISC-V IP供应商SiFive正式发布了其第三代高性能CPU IP——Performance P570 Gen 3。官方将其定位为当前功能最强大、效率最高的乱序执行处理器核心,旨在满足边缘AI
新智元报道编辑:Aeneas KingHZ【新智元导读】刚刚,Anthropic首度实锤:大模型真有「情绪」!激活绝望神经元后,Claude会撒谎、作弊甚至勒索。AI内心戏曝光,人类对齐面临失控危机
新智元报道编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用tok
编辑|泽南、杨文没想到这次大面积市场震荡,还引出了学术大瓜。本周五晚,谷歌的学术不端事件成为了 AI 圈的焦点。来自苏黎世联邦理工学院(ETH Zurich)的博士后高健扬在知乎发布文章,表示 Go
文 | 盘古智库当前,市场上流行一种极度简化的商业叙事:将中国丰富的绿电资源视为人工智能时代的“新煤矿”。其基本逻辑可以表述为:利用西部低至 0 3 元每度的电力优势驱动大规模智算中心,通过算力芯片
热门专题
热门推荐
微信群里的接龙,方便是真方便,但整理起来,那叫一个头疼。手动复制粘贴,不仅耗时费力,还容易出错、遗漏,最后导出的表格格式五花八门,看着就心累。 有没有一种方法,能让这个过程自动化,让数据自己“跑”进表格里?答案是肯定的。借助一些工具,我们可以实现群内接龙数据的自动识别、解析和归档。下面,就来拆解一下
VineCoin(VINE币):重塑创作者经济的区块链新星 在数字资产的浪潮中,VineCoin(VINE币)正作为一个新兴项目崭露头角。它并非又一种简单的代币,其野心在于利用区块链技术,从根本上重塑内容创作与社交互动的经济规则。可以说,它致力于成为一个去中心化生态系统的核心引擎,目标是为全球的内容
ToClaw文件整理术:一键清理桌面杂乱文件的秘籍 | AI智能文件管理教程 利用AI智能助手整理电脑桌面文件,愿景虽好,但在实际应用中,你是否也遇到过分类不准确、指令执行失败,甚至文件被误移的困扰?请放心,这些问题往往源于几个关键的设置步骤尚未完善。掌握以下这套经过验证的ToClaw文件整理优化方
三星电子工会确认原定罢工计划未取消,但将遵守法院禁令,确保罢工不影响正常生产流程。劳资博弈进入微妙阶段,工会需在法律框架内施压,公司生产秩序暂获法律庇护,后续发展取决于双方谈判。
千问AI赋能社群自动化运营:一、关键词触发智能回复;二、定时任务精准推送;三、敏感词实时过滤预警;四、成员标签化智能分组。 社群运营工作繁杂,常常需要处理大量重复性任务,如解答常见问题、发布定时通知、监控群内动态等,这让运营者倍感压力。如何实现高效、智能的社群管理,解放人力?利用千问AI的强大功能,





