向量数据库会因大模型热潮变成"摆设"吗?对话Zilliz创始人星爵
Zilliz星爵深度对话:向量数据库在大模型时代会被边缘化吗?
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

NVIDIA GTC 2024 大会成为向量数据库行业的重要转折点。在这场科技盛会上,黄仁勋正式宣布与 Milvus 项目达成深度合作,Zilliz 公司团队获得三次登台演讲的机会;无独有偶,大会结束后短短三天,OpenAI 就宣布与 Zilliz 建立合作关系,在其发布的 ChatGPT-retrieval-plugin 产品中集成 Milvus 和 Zilliz Cloud 服务。
向量数据库的机遇与挑战
回溯2024年,大模型技术高速发展的同时也暴露出明显短板:频发的"幻觉"现象和专业领域知识的匮乏,成为阻碍大模型实际应用的主要障碍。作为大模型的"外部记忆模块",向量数据库通过本地知识的语义检索功能,完美填补了大模型落地的关键缺口。
在这一技术演进过程中,RAG(检索增强生成)架构迅速崛起,成为连接大模型与向量数据库的理想范式。它不仅延续了向量数据库在电商推荐、自动驾驶等领域的成功经验,更开辟了大模型时代的全新应用场景。
然而时移世易,2025年Zilliz CEO星爵在接受专访时却作出惊人论断:传统RAG模式已走到尽头。他认为随着推理模型技术的突破,用户对大模型的知识检索需求已经从"一次性问答"升级为"系统性研究"——需要模型具备问题拆解、多轮检索、逐步完善的能力。
基于这一洞察,Zilliz在2025年2月推出基于DeepResearch理念的开源项目DeepSearcher。仅用一个月时间,该项目就在GitHub上斩获近5000个star,市场热度可见一斑。
从Oracle到Zilliz的创业之路

在创立Zilliz之前,星爵有着传奇的职业经历。2009-2015年间,他作为核心成员参与Oracle云数据库产品研发,成为该项目最早的五位工程师之一。这段经历不仅让他接触到全球顶尖的数据库系统,更坚定了他"云计算代表未来"的技术信仰。
Oracle期间的一段插曲尤其令人难忘。入职第一天,星爵在电梯里邂逅了一位推着自行车、带着浓重法国口音的工程师。此后两年多,两人同在Oracle美国总部400号楼7层工作,直到2012年这位工程师离职创业。这位名叫Thierry Cruanes的同事,后来创办的公司正是大名鼎鼎的Snowflake。
"亲眼见证奇迹的发生具有强大的感染力,"星爵回忆道,"它会激发你去突破现状、勇于创新,打造属于自己的传奇。"
怀揣这样的信念,星爵于2017年创立Zilliz。在那个大模型尚未爆发的年代,他就前瞻性地选择向量数据库作为创业方向。"世界上80%的数据都是非结构化的,AI技术让我们有机会高效处理这些数据。这个机遇让我无比兴奋。"从早期融资屡屡碰壁,到后来在Forrester Wave™向量数据库报告中荣膺领导者象限最高分,他将这段历程称为"理想主义工程师的伟大冒险"。
然而Zilliz的发展始终伴随质疑:开源模式的价值?向量数据库的必要性?特别是在大模型能力突飞猛进的当下,向量数据库是否会被逐步边缘化?在探讨公司商业化进程的同时,星爵也对这些问题给出了回应。以下是经过整理的对话精华。
技术演进与未来展望
Q:随着DeepSeek等推理大模型的出现,传统RAG应用是否会沦为"鸡肋"?向量数据库的价值是否在弱化?
星爵:短期内,基于公开数据的RAG应用确实会受到冲击。但对企业私有数据与大模型的结合场景,向量数据库仍是不可替代的基础设施。中期来看,推理模型反而会加速AI应用普及,催生更多非结构化数据处理需求,实际上扩大了向量数据库的市场空间。
从更长的时间维度看,计算与存储的协同始终是计算机系统的基本范式。就像当年冯·诺依曼架构提出时,也一度有人质疑存储设备的必要性。但历史证明,算力提升与存储需求增长始终相辅相成。预计未来五年产生的非结构化数据将超过历史总和,这更凸显了存算协同架构的重要性。
Q:能介绍一下DeepSearcher开源项目的背景吗?
星爵:OpenAI推出的DeepResearch工具虽然强大,但每月200美元的订阅费门槛较高,且在处理企业本地数据时存在效率瓶颈。我们开发的DeepSearcher通过本地部署实现了类似功能,将大模型、高级搜索和研究能力整合为一,特别优化了对本地数据的处理效率。项目发布一个月内就在GitHub收获近5000星,市场反响超出预期。
Q:为何如此看好DeepResearch类产品?
星爵:我们认为Agentic RAG终将完全取代传统RAG模式。传统方案只能进行单次检索,适合解决简单问题。而Agentic RAG能通过思维链拆分复杂问题,针对每个子任务进行精准检索,实现多轮信息获取,显著降低大模型的幻觉概率。
Q:在AI Agent时代,向量数据库将扮演什么角色?
星爵:AI Agent需要处理复合型任务,这就要求可靠的记忆系统来存储中间状态。向量数据库能高效管理非结构化数据,为Agent提供长期记忆和知识检索能力。目前Agent技术面临的主要挑战在应用场景发掘方面,随着这些问题的解决,向量数据库作为核心基础设施的价值将进一步凸显。
(对话持续深入探讨开源策略、商业化进程、技术挑战等话题,完整内容详见原文)
相关攻略
Prometheus对于不同的数据库,有各种专门的Exporter进行监控,本文将介绍基于Prometheus监控postgresql数据库的解决方案。 Postgresql数据库是一款热门的开源关
在之前的文章中,举了一个强制类型转换导致死锁的例子,有朋友询问是不是类型转换都不能命中索引,花1分钟细说一下。 《两个小公举,调试MySQL死锁必备!》中,举了一个强制类型转换导致死锁的例子,有朋友
SQL Server的查询计划全靠统计信息“指路”,一旦统计信息过期,数据库就会“瞎猜”数据分布,要么生成低效查询计划,要么计数失真,堪称DBA的“隐形坑”。 明明SQL没写错,count(*)时而
3月1日消息,国家安全部最新发文,提醒企业对于数据托管切莫“托而不管”,并特别提到了境外黑客攻击某电商平台数据库的案例。如今,不少企业选择将数据存储在数据托管平台,降本增效,省心省力,但这也潜藏着威
SQL Server日志、备份、临时文件,加之系统缓存、冗余数据,极易导致磁盘告急,轻则影响数据库运行,重则引发宕机。因此,快速精准定位空间占用源头,是DBA必备能力。在接触TreeSizeFree
热门专题
热门推荐
微信文件助手网页版轻量使用入口地址是https: filehelper weixin qq com,支持多端同步、界面简洁、传输稳定且资源占用低。微信文件助手网页版轻量使用入口地
在使用adobe photoshop进行设计工作时,安装新字体能为作品增添丰富多样的风格和视觉效果。以下为您详细介绍安装新字体的具体步骤。首先,您需要获取新字体文件。字体文件通常以
我的世界里面有很多的mod,模组中所有内容的合成都是不一样的,今天给大家带来了游戏里面的光谱世界模组合成图鉴分享,还有小伙伴不清楚,那么下面就是具体的内容 我的世界光谱世界合成表大
IT之家 3 月 26 日消息,英伟达昨日(3 月 25 日)发布 GeForce 596 02 版本热修复显卡驱动,专门修复《明日方舟:终末地》游戏画面卡顿问题。IT之家注:在发布节奏方面,英伟达
BOSS直聘网页版登录入口为https: www zhipin com ,支持直接输入网址、搜索引擎正式链接、地域分站及手机扫码登录四种方式。BOSS直聘网页版登录入口在哪里?这





