游乐游手机版
首页/科技数码/文章详情

向量数据库会因大模型热潮变成"摆设"吗?对话Zilliz创始人星爵

时间:2025-09-17 15:59
在 NVIDIA GTC 2024 大会上,黄仁勋官宣了和 Milvus 项目合作,Zilliz 被三次邀请上台演讲;大会三天之后,OpenAI 官宣和 Zilliz 合作,在发布的 chatgpt

Zilliz星爵深度对话:向量数据库在大模型时代会被边缘化吗?

对话Zilliz星爵

NVIDIA GTC 2024 大会成为向量数据库行业的重要转折点。在这场科技盛会上,黄仁勋正式宣布与 Milvus 项目达成深度合作,Zilliz 公司团队获得三次登台演讲的机会;无独有偶,大会结束后短短三天,OpenAI 就宣布与 Zilliz 建立合作关系,在其发布的 ChatGPT-retrieval-plugin 产品中集成 Milvus 和 Zilliz Cloud 服务。

向量数据库的机遇与挑战

回溯2024年,大模型技术高速发展的同时也暴露出明显短板:频发的"幻觉"现象和专业领域知识的匮乏,成为阻碍大模型实际应用的主要障碍。作为大模型的"外部记忆模块",向量数据库通过本地知识的语义检索功能,完美填补了大模型落地的关键缺口。

在这一技术演进过程中,RAG(检索增强生成)架构迅速崛起,成为连接大模型与向量数据库的理想范式。它不仅延续了向量数据库在电商推荐、自动驾驶等领域的成功经验,更开辟了大模型时代的全新应用场景。

然而时移世易,2025年Zilliz CEO星爵在接受专访时却作出惊人论断:传统RAG模式已走到尽头。他认为随着推理模型技术的突破,用户对大模型的知识检索需求已经从"一次性问答"升级为"系统性研究"——需要模型具备问题拆解、多轮检索、逐步完善的能力。

基于这一洞察,Zilliz在2025年2月推出基于DeepResearch理念的开源项目DeepSearcher。仅用一个月时间,该项目就在GitHub上斩获近5000个star,市场热度可见一斑。

从Oracle到Zilliz的创业之路

Zilliz CEO 星爵

在创立Zilliz之前,星爵有着传奇的职业经历。2009-2015年间,他作为核心成员参与Oracle云数据库产品研发,成为该项目最早的五位工程师之一。这段经历不仅让他接触到全球顶尖的数据库系统,更坚定了他"云计算代表未来"的技术信仰。

Oracle期间的一段插曲尤其令人难忘。入职第一天,星爵在电梯里邂逅了一位推着自行车、带着浓重法国口音的工程师。此后两年多,两人同在Oracle美国总部400号楼7层工作,直到2012年这位工程师离职创业。这位名叫Thierry Cruanes的同事,后来创办的公司正是大名鼎鼎的Snowflake。

"亲眼见证奇迹的发生具有强大的感染力,"星爵回忆道,"它会激发你去突破现状、勇于创新,打造属于自己的传奇。"

怀揣这样的信念,星爵于2017年创立Zilliz。在那个大模型尚未爆发的年代,他就前瞻性地选择向量数据库作为创业方向。"世界上80%的数据都是非结构化的,AI技术让我们有机会高效处理这些数据。这个机遇让我无比兴奋。"从早期融资屡屡碰壁,到后来在Forrester Wave™向量数据库报告中荣膺领导者象限最高分,他将这段历程称为"理想主义工程师的伟大冒险"。

然而Zilliz的发展始终伴随质疑:开源模式的价值?向量数据库的必要性?特别是在大模型能力突飞猛进的当下,向量数据库是否会被逐步边缘化?在探讨公司商业化进程的同时,星爵也对这些问题给出了回应。以下是经过整理的对话精华。

技术演进与未来展望

Q:随着DeepSeek等推理大模型的出现,传统RAG应用是否会沦为"鸡肋"?向量数据库的价值是否在弱化?

星爵:短期内,基于公开数据的RAG应用确实会受到冲击。但对企业私有数据与大模型的结合场景,向量数据库仍是不可替代的基础设施。中期来看,推理模型反而会加速AI应用普及,催生更多非结构化数据处理需求,实际上扩大了向量数据库的市场空间。

从更长的时间维度看,计算与存储的协同始终是计算机系统的基本范式。就像当年冯·诺依曼架构提出时,也一度有人质疑存储设备的必要性。但历史证明,算力提升与存储需求增长始终相辅相成。预计未来五年产生的非结构化数据将超过历史总和,这更凸显了存算协同架构的重要性。

Q:能介绍一下DeepSearcher开源项目的背景吗?

星爵:OpenAI推出的DeepResearch工具虽然强大,但每月200美元的订阅费门槛较高,且在处理企业本地数据时存在效率瓶颈。我们开发的DeepSearcher通过本地部署实现了类似功能,将大模型、高级搜索和研究能力整合为一,特别优化了对本地数据的处理效率。项目发布一个月内就在GitHub收获近5000星,市场反响超出预期。

Q:为何如此看好DeepResearch类产品?

星爵:我们认为Agentic RAG终将完全取代传统RAG模式。传统方案只能进行单次检索,适合解决简单问题。而Agentic RAG能通过思维链拆分复杂问题,针对每个子任务进行精准检索,实现多轮信息获取,显著降低大模型的幻觉概率。

Q:在AI Agent时代,向量数据库将扮演什么角色?

星爵:AI Agent需要处理复合型任务,这就要求可靠的记忆系统来存储中间状态。向量数据库能高效管理非结构化数据,为Agent提供长期记忆和知识检索能力。目前Agent技术面临的主要挑战在应用场景发掘方面,随着这些问题的解决,向量数据库作为核心基础设施的价值将进一步凸显。

(对话持续深入探讨开源策略、商业化进程、技术挑战等话题,完整内容详见原文)

来源:https://www.leiphone.com/category/fintech/NDInk8Qz9DsdTTPy.html
上一篇秦淮REITs筹备提速:东阳光接盘贝恩股权的战略布局 下一篇腾讯企点营销云推出Magic Agent,AI赋能全链路营销解决方案
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。