首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
VexDB迈向DB4AI:探索首个成功实践的关键路径

VexDB迈向DB4AI:探索首个成功实践的关键路径

热心网友
93
转载
2025-10-30

Oracle 将其数据库版本从 23C 更名为 23AI,这个变动恰恰说明公司在 AI 浪潮兴起之初,其实并没有做好充分准备。当数据库融合技术才刚刚起步,他们就匆忙转向了AI领域。值得庆幸的是,数据融合与AI发展的大方向是一致的,所以这段转型并没有走太多弯路。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

最近不少国内数据库厂商也在探讨 DB4AI 的发展路径,前段时间我还专门梳理了 Oracle 在 DB4AI 方向上的最新动态。从这些进展中,我深刻体会到 DB4AI 在传统关系型数据库中的演进轨迹。

图片图片

Oracle 的 23AI 源自 23C 的更名,反映出公司面对AI爆发点的准备不足。在数据库融合技术刚起步时,他们就匆匆转向了AI方向。幸运的是,融合与AI的大方向是一致的,所以并没有走什么弯路。

和大多数关系型数据库类似,Oracle 的 DB4AI 也是从向量类型支持起步的。他们首先集成了数据库的AI应用支持能力,再根据用户需求逐步完善功能模块,借助大量 UTL* 工具为AI应用开发提供所需支持。在最新版本中,Oracle 已经发展到能够为大规模 AI 应用提供强大能力支撑的阶段,比如 IVF 索引的在线重定义(解决大量更新后索引失效的问题)、外表支持(降低AI数据导入复杂度)、VECTOR_MEMORY_SIZE(自动优化性能)、HNSW 图的快照更新(针对修改量大的表进行性能优化)、JSON 能力融合(更方便地构建应用)、向量索引中的覆盖字段(提升应用性能)等,这些都是为了解决AI应用开发中的难点和痛点。

我不禁感慨,在 DB4AI 这条路上,Oracle 又在孤独前行了,真心希望国产数据库也能尽快赶上。前几天 VexDB 的发布会让我眼前一亮,从中感受到了国产数据库追赶先进技术的身影。

在这次发布会上,国良老师作为数智引航的技术顾问,代表技术团队发布了一款为AI而生的向量数据库产品——VexDB。我花了两天时间研究了这款数据库,虽然还没有亲自使用 VexDB 做些小项目来验证,不过在探索过程中还是收获了一些惊喜。

与国内其他 DB4AI 产品相比,VexDB 在技术理念上有较大差异。它的产品定位和技术路线与 Oracle 十分相似,我个人认为目前 Oracle 的路线应该是比较合理的。

DB4AI 的起点必然是关系型数据库中的向量支持,或者是向量数据库中的 OLTP 支持,纯粹的向量数据库应用场景会受到很大限制。虽然 DB4AI 应该从向量入手,但不能像目前绝大多数 DB4AI 功能那样只围绕向量来做,而是应该围绕AI应用的实际需求来设计。下面我们来看看 VexDB 在 DB4AI 方向上的一些值得称道的亮点。

首先 VexDB 在初期版本就构建了完善的应用程序生态,在组件编排上支持了目前最流行的AI应用框架,包括 LangChain、Dify、MaxKB、RagFlow、OpenWebUI 等。目前大量的AI应用都采用了这些框架,因此 VexDB 很容易将这些框架上开发的AI应用从其他专用向量数据库中迁移过来,这为 VexDB 的快速发展提供了有力支撑。Oracle 在 23AI 的第一个版本中也通过与 CoHere 等厂商的集成,打通了数据库与AI应用之间的管道。

p>既然 DB4AI 是为AI应用而生的,那么数据库厂商就需要了解目前用户都在开发什么样的应用。其实很多企业的第一个AI应用大多都是知识库、知识问答之类的系统。围绕向量数据类型来提供知识库开发能力是向量数据库必须具备的,不过想要做好这一点并不容易。目前绝大多数国产数据库具有的向量数据库支持不外乎向量标量混合检索的能力,似乎大家努力方向都差不多,但如果仔细看看内部细节,却差别很大。

VexDB 在这个方向上做了一些微创新,比如在向量索引上,VexDB 支持多种基于磁盘的向量索引结构,提供了 IVFFLAT/IVFPQ/Graph_index/DiskANN 索引,其中后三种索引是目前绝大多数国产数据库没有涉及的。

与传统索引不同,向量索引不仅仅是为了提高检索速度,更能够提高向量检索的能力。支持的索引种类越多,就能支持更多的应用场景。

除了向量索引之外,VexDB 在索引上还有很多令人惊喜的能力,比如向量标量联合索引 HybridANN。Oracle 在 23.6 上开始支持向量标量混合索引,当时我看到这个功能后感觉到这是一个可以大大简化知识库多路召回效率的功能,没想到 VexDB 现在也提供了类似的解决方案。

传统向量检索的召回准确性不足的问题,其实完全可以通过向量标量混合检索来解决,不过如果没有向量标量混合索引的支持,这种检索就会被割裂为向量检索、标量检索和重排三个工作,把提升准确性的工作交给了应用开发人员去做,大大增加了知识库开发的难度。

VexDB 在索引上的工作还不止如此,BM25 索引的支持让我感到非常贴心。最近我们有一个项目想通过 BM25 来提高知识库召回的准确性。BM25(Best Matching 25)是一种广泛应用于信息检索领域的概率相关性模型,用于衡量查询与文档之间的匹配程度,正好是对症下药的,但是目前我们使用的数据库中没有 BM25 索引的支持,所以做起来很纠结。

初步研究了 VexDB 的功能,从一些设计上可以看出,产品的研发人员是懂AI应用的,并没有闭门造车,而是真正在做一些帮助AI应用开发者解决现实问题的事情。我觉得在 DB4AI 的道路上,VexDB 迈出的第一步似乎是对的。

来源:https://www.51cto.com/article/826608.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

G胖退出Valve游戏开发 怕员工不敢反驳
游戏资讯
G胖退出Valve游戏开发 怕员工不敢反驳

V社联合创始人G胖调整角色:从主导开发转向赋能团队,释放创意生产力 近期一则消息引发游戏行业广泛关注:Valve联合创始人加布·纽维尔(“G胖”)在公司内部进行了一次重要角色转型。此次调整的关键原因,与他个人在公司中的特殊影响力息息相关。根据透露,这位创始人决定减少在具体游戏开发工作中的直接深度参与

热心网友
04.05
红魔姜超“冒险爆料”:Pad 新品不是四月就是五月发布,一定不让大家失望
科技数码
红魔姜超“冒险爆料”:Pad 新品不是四月就是五月发布,一定不让大家失望

红魔姜超透露:全新游戏平板将于四月或五月发布,承诺带来惊艳体验 游戏硬件领域即将迎来重磅更新。努比亚红魔游戏手机的产品线负责人姜超,近日通过社交媒体进行了一次颇具悬念的“前瞻剧透”,成功引发了广大游戏玩家和科技爱好者的高度关注。他明确指出,红魔全新一代游戏平板的发布日期已锁定在四月或五月,并使用了“

热心网友
04.05
金铲铲之战S17天煞羁绊效果一览
游戏攻略
金铲铲之战S17天煞羁绊效果一览

金铲铲之战S17天煞羁绊:效果解析与实战应用 在《金铲铲之战》S17赛季中,【天煞】是一个定位独特的专属羁绊,仅由5费英雄“劫”所携带。激活这一羁绊需要特定的前置条件——玩家必须在强化符文选择阶段获得【入侵者劫】。一旦成功解锁,劫将获得全新的技能机制,从而在战局中发挥出颠覆性的作用。 金铲铲之战S1

热心网友
04.05
蓝点工作室被索尼移除 第一方阵容调整
游戏资讯
蓝点工作室被索尼移除 第一方阵容调整

索尼调整第一方工作室阵容,王牌重制团队蓝点工作室正式“退出”核心名单 近日,索尼在其PlayStation Studios官方网站的更新中做出了一项关键调整,引发了游戏玩家和行业观察者的广泛关注:曾凭借《恶魔之魂:重制版》等作品赢得盛誉的蓝点工作室,已不再出现在索尼核心第一方工作室的名单之中。此次页

热心网友
04.05
未来人类 X98W 移动“工作站”笔记本电脑上线官网,4 月内发售
科技数码
未来人类 X98W 移动“工作站”笔记本电脑上线官网,4 月内发售

未来人类X98W移动工作站正式发布:重新定义移动端专业性能的新标杆 在专业移动计算领域,总有一些产品能够打破常规认知。近日,未来人类(TerransForce)正式在其官网上线了全新的X98W高性能移动工作站,并宣布将于本月内全面发售。这款设备的问世,无疑为那些在移动办公环境中仍需要桌面级别强悍性能

热心网友
04.05