首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
广发证券:RAG推理驱动SSD需求,关注产业链核心标的

广发证券:RAG推理驱动SSD需求,关注产业链核心标的

热心网友
87
转载
2025-12-31

据智通财经APP获悉,广发证券发布的研报指出,RAG架构为大型语言模型提供了“长效记忆”能力,随着企业个性化应用与用户专属需求的日益增长,市场对RAG存储的需求也显著提升。在AI推理过程中,RAG向量数据库存储介质正经历从“内存参与检索”向“全SSD存储架构”的演进,这趋势将持续推动高带宽、大容量固态硬盘的需求增长。建议投资者关注产业链核心受益标的。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

广发证券主要观点如下:

RAG为大模型提供“长期记忆”,企业级应用与个性化需求共同催化RAG存储需求攀升

在RAG(检索增强生成)架构中,大语言模型在生成最终答案前,会首先向向量数据库发起查询。向量数据库作为连接用户问题与外部知识库的关键枢纽,负责高效存储、管理和检索高维度的向量化知识表示,从而显著提升生成结果的准确性与时效性。从企业应用角度看,RAG正逐步渗透至在线场景(如电商、网页搜索)与离线场景(如企业内部知识库、法律文书分析、工程研究)。从个人应用层面看,个性化RAG能够保留用户长期的行为记忆、偏好习惯与上下文信息,形成专属的“用户级向量空间”,这极大地推动了RAG需求的增长。

AI推理推动RAG向量数据库发展,带动SSD需求增长

向量数据库存储介质需要承载海量向量数据及索引结构,必须支持高吞吐和低时延,以满足高并发场景下的快速向量相似度检索需求。目前,向量数据库存储介质正从“内存参与检索”逐步走向“全SSD存储架构”。根据《All-in-storage ANNS Algorithms Optimize VectorDB Usability within a RAG System》中以KIOXIA AiSAQ为例的研究,向量、PQ量化结果及索引统一存放于SSD中,规模达百亿级别的向量数据所需SSD总容量约为11.2TB,其中PQ向量占1.28TB,索引占10TB。在采用TLC/QLC SSD的情况下,AiSAQ相比基于DiskANN的架构具备4-7倍的成本优势。此外,AiSAQ架构中所有租户数据处于活跃就绪状态,查询请求可直接执行,无需经历先将数据从SSD加载至DRAM才能开始查询的“冷启动”延迟,从而提升了RAG系统的规模化扩展能力与经济可行性。

火山引擎TOS Vectors开启向量存储新模式,提升SSD需求预期

根据火山引擎开发者社区公众号信息,TOS推出Vector Bucket架构。该架构采用字节自研的云原生向量索引库Kiwi,并结合了多层级的本地缓存协同架构(覆盖DRAM、SSD与远程对象存储)。在数据规模巨大、存储周期长且查询频率相对较低的场景下,该架构不仅能满足高频与低频数据的分层存储需求,而且显著降低了企业大规模使用向量数据的技术与成本门槛。TOS Vectors与火山引擎高性能向量数据库、火山AI Agent等产品深度协同。以交互型Agent场景为例,将高频访问的记忆(如用户核心偏好、近期任务执行结果等)存放于向量数据库中,可实现毫秒级的高频检索;同时将低频访问的记忆(如数月前的交互记录或历史执行结果)沉淀至TOS Vectors中,允许秒级延迟,以此换取更低的存储成本和更广阔的存储空间。而在处理复杂任务的Agent场景中,TOS Vectors既能承载海量的语义向量存储,又能确保长期数据的可持续积累。

风险提示

AI产业发展以及相关需求不及预期;AI服务器出货量不及预期;国产厂商技术和产品进展不及预期。

来源:https://www.163.com/dy/article/KI3LLD6705198UNI.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路
AI
DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路

新智元报道编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用tok

热心网友
03.30
谷歌AI论文涉学术造假,洗白内存占用了900亿刀?
AI
谷歌AI论文涉学术造假,洗白内存占用了900亿刀?

编辑|泽南、杨文没想到这次大面积市场震荡,还引出了学术大瓜。本周五晚,谷歌的学术不端事件成为了 AI 圈的焦点。来自苏黎世联邦理工学院(ETH Zurich)的博士后高健扬在知乎发布文章,表示 Go

热心网友
03.30
电价优势如何助力低成本Token出海:机遇与路径解析
科技数码
电价优势如何助力低成本Token出海:机遇与路径解析

文 | 盘古智库当前,市场上流行一种极度简化的商业叙事:将中国丰富的绿电资源视为人工智能时代的“新煤矿”。其基本逻辑可以表述为:利用西部低至 0 3 元每度的电力优势驱动大规模智算中心,通过算力芯片

热心网友
03.29
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公
AI
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而

热心网友
03.28
凯洛特科技专利申请:如何精准采集与修复VR数据提升体验
科技数码
凯洛特科技专利申请:如何精准采集与修复VR数据提升体验

国家知识产权局信息显示,青岛凯洛特科技有限公司申请一项名为“一种虚拟现实数据采集及修复方法”的专利,公开号CN121707869A,申请日期为2025年12月。专利摘要显示,本发明提供了一种虚拟现实

热心网友
03.28

最新APP

铁锈战争
铁锈战争
棋牌策略 03-31
你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29

热门推荐

Sharkoon 旋刚推出双模全配列机械键盘 OfficePal K70W
科技数码
Sharkoon 旋刚推出双模全配列机械键盘 OfficePal K70W

Sharkoon旋刚推出双模全配列机械键盘OfficePal K70W 机械键盘市场又添新选择。日前,Sharkoon旋刚正式发布了旗下新款双模全配列机械键盘——OfficePal K70W。这款产品为用户提供了段落有声和线性静音两种轴体选项,值得一提的是,无论是哪种轴体,官方标称的按键寿命都达到了

热心网友
03.31
风车动漫观看指南:正版入口与在线平台推荐
电脑教程
风车动漫观看指南:正版入口与在线平台推荐

风车动漫最新在线网入口地址是https: www fcdman com ,该平台提供海量动画资源、流畅观看体验及便捷功能,如多类型番剧、无广告播放、进度记忆和快速更新等。风车动漫

热心网友
03.31
什么是晨星烛台形态?晨星蜡烛图形态详细介绍
web3.0
什么是晨星烛台形态?晨星蜡烛图形态详细介绍

什么是晨星烛台形态?晨星蜡烛图形态详细介绍 什么是晨星烛台形态? 在股票、外汇乃至加密货币市场上,交易者们常常睁大眼睛寻找趋势反转的蛛丝马迹。其中,晨星烛台形态就是一个备受青睐的看涨反转信号。它通常出现在一波下跌行情即将衰竭的末端,像黎明前的第一道曙光,暗示着市场情绪可能正在悄然转变。 典型的晨星形

热心网友
03.31
小红书官网登录入口查找与登录指南
手机教程
小红书官网登录入口查找与登录指南

在当今数字化的时代,社交平台成为了人们生活中不可或缺的一部分。而小红书app,凭借其独特的内容分享模式和丰富多样的生活资讯,吸引了无数用户的关注。你是否想知道如何快速便捷地登录小红

热心网友
03.31
曝苹果2026年还将发布十多款新品 iPhone Fold领衔
iphone
曝苹果2026年还将发布十多款新品 iPhone Fold领衔

曝苹果2026年还将发布十多款新品 iPhone Fold领衔 本周,随着新款MacBook Air、MacBook Pro以及iPhone 17e等多达七款产品搭载M5芯片亮相,苹果今年的首轮产品攻势算是告一段落了。但这远不是终点,事实上,今年的好戏才刚刚拉开序幕。 目光转向桌面端,Studio

热心网友
03.31