游乐游手机版
首页/科技数码/文章详情

VexDB迈向DB4AI:探索首个成功实践的关键路径

时间:2025-10-30 20:43
Oracle的23AI是从23C改名而来的,这说明Oracle刚开始的时候对于AI的爆发点也是准备不足的,在融合数据库刚刚起步的时候匆匆忙忙转向了AI方向。幸运的是,融合和AI的大方向是一致的,所以

Oracle 将其数据库版本从 23C 更名为 23AI,这个变动恰恰说明公司在 AI 浪潮兴起之初,其实并没有做好充分准备。当数据库融合技术才刚刚起步,他们就匆忙转向了AI领域。值得庆幸的是,数据融合与AI发展的大方向是一致的,所以这段转型并没有走太多弯路。

最近不少国内数据库厂商也在探讨 DB4AI 的发展路径,前段时间我还专门梳理了 Oracle 在 DB4AI 方向上的最新动态。从这些进展中,我深刻体会到 DB4AI 在传统关系型数据库中的演进轨迹。

图片图片

Oracle 的 23AI 源自 23C 的更名,反映出公司面对AI爆发点的准备不足。在数据库融合技术刚起步时,他们就匆匆转向了AI方向。幸运的是,融合与AI的大方向是一致的,所以并没有走什么弯路。

和大多数关系型数据库类似,Oracle 的 DB4AI 也是从向量类型支持起步的。他们首先集成了数据库的AI应用支持能力,再根据用户需求逐步完善功能模块,借助大量 UTL* 工具为AI应用开发提供所需支持。在最新版本中,Oracle 已经发展到能够为大规模 AI 应用提供强大能力支撑的阶段,比如 IVF 索引的在线重定义(解决大量更新后索引失效的问题)、外表支持(降低AI数据导入复杂度)、VECTOR_MEMORY_SIZE(自动优化性能)、HNSW 图的快照更新(针对修改量大的表进行性能优化)、JSON 能力融合(更方便地构建应用)、向量索引中的覆盖字段(提升应用性能)等,这些都是为了解决AI应用开发中的难点和痛点。

我不禁感慨,在 DB4AI 这条路上,Oracle 又在孤独前行了,真心希望国产数据库也能尽快赶上。前几天 VexDB 的发布会让我眼前一亮,从中感受到了国产数据库追赶先进技术的身影。

在这次发布会上,国良老师作为数智引航的技术顾问,代表技术团队发布了一款为AI而生的向量数据库产品——VexDB。我花了两天时间研究了这款数据库,虽然还没有亲自使用 VexDB 做些小项目来验证,不过在探索过程中还是收获了一些惊喜。

与国内其他 DB4AI 产品相比,VexDB 在技术理念上有较大差异。它的产品定位和技术路线与 Oracle 十分相似,我个人认为目前 Oracle 的路线应该是比较合理的。

DB4AI 的起点必然是关系型数据库中的向量支持,或者是向量数据库中的 OLTP 支持,纯粹的向量数据库应用场景会受到很大限制。虽然 DB4AI 应该从向量入手,但不能像目前绝大多数 DB4AI 功能那样只围绕向量来做,而是应该围绕AI应用的实际需求来设计。下面我们来看看 VexDB 在 DB4AI 方向上的一些值得称道的亮点。

首先 VexDB 在初期版本就构建了完善的应用程序生态,在组件编排上支持了目前最流行的AI应用框架,包括 LangChain、Dify、MaxKB、RagFlow、OpenWebUI 等。目前大量的AI应用都采用了这些框架,因此 VexDB 很容易将这些框架上开发的AI应用从其他专用向量数据库中迁移过来,这为 VexDB 的快速发展提供了有力支撑。Oracle 在 23AI 的第一个版本中也通过与 CoHere 等厂商的集成,打通了数据库与AI应用之间的管道。

p>既然 DB4AI 是为AI应用而生的,那么数据库厂商就需要了解目前用户都在开发什么样的应用。其实很多企业的第一个AI应用大多都是知识库、知识问答之类的系统。围绕向量数据类型来提供知识库开发能力是向量数据库必须具备的,不过想要做好这一点并不容易。目前绝大多数国产数据库具有的向量数据库支持不外乎向量标量混合检索的能力,似乎大家努力方向都差不多,但如果仔细看看内部细节,却差别很大。

VexDB 在这个方向上做了一些微创新,比如在向量索引上,VexDB 支持多种基于磁盘的向量索引结构,提供了 IVFFLAT/IVFPQ/Graph_index/DiskANN 索引,其中后三种索引是目前绝大多数国产数据库没有涉及的。

与传统索引不同,向量索引不仅仅是为了提高检索速度,更能够提高向量检索的能力。支持的索引种类越多,就能支持更多的应用场景。

除了向量索引之外,VexDB 在索引上还有很多令人惊喜的能力,比如向量标量联合索引 HybridANN。Oracle 在 23.6 上开始支持向量标量混合索引,当时我看到这个功能后感觉到这是一个可以大大简化知识库多路召回效率的功能,没想到 VexDB 现在也提供了类似的解决方案。

传统向量检索的召回准确性不足的问题,其实完全可以通过向量标量混合检索来解决,不过如果没有向量标量混合索引的支持,这种检索就会被割裂为向量检索、标量检索和重排三个工作,把提升准确性的工作交给了应用开发人员去做,大大增加了知识库开发的难度。

VexDB 在索引上的工作还不止如此,BM25 索引的支持让我感到非常贴心。最近我们有一个项目想通过 BM25 来提高知识库召回的准确性。BM25(Best Matching 25)是一种广泛应用于信息检索领域的概率相关性模型,用于衡量查询与文档之间的匹配程度,正好是对症下药的,但是目前我们使用的数据库中没有 BM25 索引的支持,所以做起来很纠结。

初步研究了 VexDB 的功能,从一些设计上可以看出,产品的研发人员是懂AI应用的,并没有闭门造车,而是真正在做一些帮助AI应用开发者解决现实问题的事情。我觉得在 DB4AI 的道路上,VexDB 迈出的第一步似乎是对的。

来源:https://www.51cto.com/article/826608.html
上一篇小区监控、门禁瘫痪原因何在?全网瘫痪内幕揭秘 下一篇业务开发中这些场景易触发FullGC,你遇到过几个?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5