游乐游手机版
首页/科技数码/文章详情

VexDB迈向DB4AI:探索首个成功实践的关键路径

时间:2025-10-30 20:43
Oracle的23AI是从23C改名而来的,这说明Oracle刚开始的时候对于AI的爆发点也是准备不足的,在融合数据库刚刚起步的时候匆匆忙忙转向了AI方向。幸运的是,融合和AI的大方向是一致的,所以

Oracle 将其数据库版本从 23C 更名为 23AI,这个变动恰恰说明公司在 AI 浪潮兴起之初,其实并没有做好充分准备。当数据库融合技术才刚刚起步,他们就匆忙转向了AI领域。值得庆幸的是,数据融合与AI发展的大方向是一致的,所以这段转型并没有走太多弯路。

最近不少国内数据库厂商也在探讨 DB4AI 的发展路径,前段时间我还专门梳理了 Oracle 在 DB4AI 方向上的最新动态。从这些进展中,我深刻体会到 DB4AI 在传统关系型数据库中的演进轨迹。

图片图片

Oracle 的 23AI 源自 23C 的更名,反映出公司面对AI爆发点的准备不足。在数据库融合技术刚起步时,他们就匆匆转向了AI方向。幸运的是,融合与AI的大方向是一致的,所以并没有走什么弯路。

和大多数关系型数据库类似,Oracle 的 DB4AI 也是从向量类型支持起步的。他们首先集成了数据库的AI应用支持能力,再根据用户需求逐步完善功能模块,借助大量 UTL* 工具为AI应用开发提供所需支持。在最新版本中,Oracle 已经发展到能够为大规模 AI 应用提供强大能力支撑的阶段,比如 IVF 索引的在线重定义(解决大量更新后索引失效的问题)、外表支持(降低AI数据导入复杂度)、VECTOR_MEMORY_SIZE(自动优化性能)、HNSW 图的快照更新(针对修改量大的表进行性能优化)、JSON 能力融合(更方便地构建应用)、向量索引中的覆盖字段(提升应用性能)等,这些都是为了解决AI应用开发中的难点和痛点。

我不禁感慨,在 DB4AI 这条路上,Oracle 又在孤独前行了,真心希望国产数据库也能尽快赶上。前几天 VexDB 的发布会让我眼前一亮,从中感受到了国产数据库追赶先进技术的身影。

在这次发布会上,国良老师作为数智引航的技术顾问,代表技术团队发布了一款为AI而生的向量数据库产品——VexDB。我花了两天时间研究了这款数据库,虽然还没有亲自使用 VexDB 做些小项目来验证,不过在探索过程中还是收获了一些惊喜。

与国内其他 DB4AI 产品相比,VexDB 在技术理念上有较大差异。它的产品定位和技术路线与 Oracle 十分相似,我个人认为目前 Oracle 的路线应该是比较合理的。

DB4AI 的起点必然是关系型数据库中的向量支持,或者是向量数据库中的 OLTP 支持,纯粹的向量数据库应用场景会受到很大限制。虽然 DB4AI 应该从向量入手,但不能像目前绝大多数 DB4AI 功能那样只围绕向量来做,而是应该围绕AI应用的实际需求来设计。下面我们来看看 VexDB 在 DB4AI 方向上的一些值得称道的亮点。

首先 VexDB 在初期版本就构建了完善的应用程序生态,在组件编排上支持了目前最流行的AI应用框架,包括 LangChain、Dify、MaxKB、RagFlow、OpenWebUI 等。目前大量的AI应用都采用了这些框架,因此 VexDB 很容易将这些框架上开发的AI应用从其他专用向量数据库中迁移过来,这为 VexDB 的快速发展提供了有力支撑。Oracle 在 23AI 的第一个版本中也通过与 CoHere 等厂商的集成,打通了数据库与AI应用之间的管道。

p>既然 DB4AI 是为AI应用而生的,那么数据库厂商就需要了解目前用户都在开发什么样的应用。其实很多企业的第一个AI应用大多都是知识库、知识问答之类的系统。围绕向量数据类型来提供知识库开发能力是向量数据库必须具备的,不过想要做好这一点并不容易。目前绝大多数国产数据库具有的向量数据库支持不外乎向量标量混合检索的能力,似乎大家努力方向都差不多,但如果仔细看看内部细节,却差别很大。

VexDB 在这个方向上做了一些微创新,比如在向量索引上,VexDB 支持多种基于磁盘的向量索引结构,提供了 IVFFLAT/IVFPQ/Graph_index/DiskANN 索引,其中后三种索引是目前绝大多数国产数据库没有涉及的。

与传统索引不同,向量索引不仅仅是为了提高检索速度,更能够提高向量检索的能力。支持的索引种类越多,就能支持更多的应用场景。

除了向量索引之外,VexDB 在索引上还有很多令人惊喜的能力,比如向量标量联合索引 HybridANN。Oracle 在 23.6 上开始支持向量标量混合索引,当时我看到这个功能后感觉到这是一个可以大大简化知识库多路召回效率的功能,没想到 VexDB 现在也提供了类似的解决方案。

传统向量检索的召回准确性不足的问题,其实完全可以通过向量标量混合检索来解决,不过如果没有向量标量混合索引的支持,这种检索就会被割裂为向量检索、标量检索和重排三个工作,把提升准确性的工作交给了应用开发人员去做,大大增加了知识库开发的难度。

VexDB 在索引上的工作还不止如此,BM25 索引的支持让我感到非常贴心。最近我们有一个项目想通过 BM25 来提高知识库召回的准确性。BM25(Best Matching 25)是一种广泛应用于信息检索领域的概率相关性模型,用于衡量查询与文档之间的匹配程度,正好是对症下药的,但是目前我们使用的数据库中没有 BM25 索引的支持,所以做起来很纠结。

初步研究了 VexDB 的功能,从一些设计上可以看出,产品的研发人员是懂AI应用的,并没有闭门造车,而是真正在做一些帮助AI应用开发者解决现实问题的事情。我觉得在 DB4AI 的道路上,VexDB 迈出的第一步似乎是对的。

来源:https://www.51cto.com/article/826608.html
上一篇小区监控、门禁瘫痪原因何在?全网瘫痪内幕揭秘 下一篇业务开发中这些场景易触发FullGC,你遇到过几个?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
英特尔发布雷电共享技术实现Win11 PC文件与外设共享
科技数码 · 2026-05-30

英特尔发布雷电共享技术实现Win11 PC文件与外设共享

英特尔发布ThunderboltShare雷电共享技术,通过雷电4 5接口连接两台Win11电脑,实现文件传输、外设共用和系统迁移。仅需一台设备通过认证即可使用,支持直连或通过扩展坞连接,目前主要面向高端用户。

LG 31.5英寸双模WOLED显示器上市:4K 240Hz/480Hz售8499元
科技数码 · 2026-05-30

LG 31.5英寸双模WOLED显示器上市:4K 240Hz/480Hz售8499元

5月29日,LG旗下型号为“32GX870B”的31 5英寸显示器正式在京东开售。这款新机主打4K 240Hz与FHD 480Hz双模切换,售价定在8499元。当然,这个价格对应的不只是参数,更是一套完整的旗舰级体验。 京东 LG“32GX870B”显示器 8499 元直达链接 先来看外观。32GX

惠普锐15双锐龙轻薄本开售三档定价
科技数码 · 2026-05-30

惠普锐15双锐龙轻薄本开售三档定价

惠普近日正式推出新款锐15笔记本,现已登陆主流电商平台开售。该机型提供两种处理器选择——AMD锐龙5 7535U与锐龙7 7735U,均配备512GB固态硬盘,性能足以满足日常办公、轻度创作等多元化使用场景。 价格方面,惠普锐15提供三档配置可选:锐龙5 7535U + 8GB内存版本售价4499元

小米米家淋浴花洒370mm置物台分控钢琴按键5月30日首发价999元
科技数码 · 2026-05-30

小米米家淋浴花洒370mm置物台分控钢琴按键5月30日首发价999元

小米米家淋浴花洒5月30日晚8点开售,首发价999元。配备370mm置物台、305mm顶喷,抗菌59黄铜,钢化玻璃面板配琴键分控,支持4种模式及多水路同时出水,无级控温。

集微首届存储论坛研判供需拐点国产替代迎历史窗口
科技数码 · 2026-05-30

集微首届存储论坛研判供需拐点国产替代迎历史窗口

5月27日至29日,2026第十届集微大会在上海张江科学会堂成功举办。本届大会以“AI重构未来、生态协同致远”为主题,由半导体投资联盟、浦东科创、ICT知识产权发展联盟和海望资本联合主办,爱集微承办。来自全球产业链的众多资源汇聚一堂,共同探讨产业新生态的构建方向与发展路径。 作为本届大会的重要组成部