6月29日,在OceanBase举办的发布会上,一条全新产品线正式亮相——湖库一体AI数据库产品OceanBase Lakebase。简而言之,这是一套专为Agent应用设计、原生支持多模态数据管理的数据库解决方案。
数据湖的概念大家并不陌生,它可以存储结构化、半结构化以及非结构化的各类数据。OceanBase Lakebase的核心价值,在于将数据湖的“开放性”与数据库的“功能性”深度融合——结构化数据、非结构化数据、向量数据,全部纳入统一架构,实现统一管理、加工、检索与调用。

基于这一基础平台,OceanBase同时推出了两款产品:数据生产、治理与服务工具体系OceanBase DataStudio,以及面向经营分析与业务决策的数据智能Agent OceanBase DataPilot。
OceanBase DataStudio 覆盖了从数据接入、加工、任务编排、语义建模、数据治理到Agent协作的完整链路。其目标在于帮助企业将分散的数据资产转化为可管理、可理解、可调用的服务能力。

OceanBase DataPilot 则更像是一个面向业务人员的“智能副驾驶”。业务人员只需使用自然语言,即可生成分析报告、数据看板以及可信答案,将过去依赖数据团队的分析流程,转变为可交互、可追问、可复用的决策工具。
发布会后,OceanBase CEO杨冰、CTO杨传辉与媒体进行了面对面交流。杨冰的判断直截了当:AI正在重塑数据管理方式,数据的使用者与数据形态都在发生变革。在用户端,VibeCoding催生了大量Agent应用,Agent开始承担生产任务,并需要保证长期运行的正确性与自我进化能力。在数据形态端,非结构化数据已成为可计算资产,数据必须主动流转,并具备任务理解能力。两股力量叠加,OceanBase得出的结论是:在AI时代,数据库必须实现湖库一体。
OceanBase内部也在积极转型。杨冰透露,内核团队已拆分为“一体化数据库”与“AI”两大部门,独立团队正专注于AI引擎的研发——这被视为公司面向未来的第二增长曲线。
至于全球竞争格局,杨传辉认为,在AI数据库领域,中美起步点相差不大,中国在场景丰富度与工程化落地方面甚至可能走得更快。
一、五大技术特点,一套系统代替交易库+数仓+向量库+数据湖
OceanBase Lakebase的技术架构,可以从以下五个关键维度进行拆解:
第一,湖库一体。 该架构将数据湖的开放格式与海量存储能力,同数据库的结构化管理与在线服务能力融为一体。结构化、半结构化、非结构化数据,全部纳入统一的元数据、权限、事务与生命周期管理体系。数据可直接支撑在线服务、实时分析与AI应用的运行。

第二,多模表与AI列。 多模表允许结构化字段、文本、图片、音视频、JSON、LOB、向量等数据形态,共存于同一张表的语义框架内。AI列则基于原始数据自动生成摘要、标签、向量等语义结果——相当于将模型的“理解能力”以列的形式嵌入数据库。
第三,Agent友好。 杨传辉提到一个关键点:Agent与人的最大区别在于实时性。实时性将成为AI数据库的首要需求。Lakebase原生支持面向Agent的实时上下文工程,能够统一存储与检索Agent的记忆、上下文、状态、行动记录,并通过向量、全文、结构化数据的混合搜索,为Agent提供更精准的上下文供给。同时,它还通过数据分支、逻辑库、资源隔离、快速回滚,为Agent应用创建独立且安全的数据环境。

第四,开放生态。 AI时代的数据处理不会局限于单一引擎。Lakebase基于开放式存储格式与可扩展计算架构,支持S3兼容对象存储、Iceberg开放表格式,并能对接Spark、Ray等计算引擎。

第五,一体化设计。 该方案从架构层面减少数据冗余、缩短处理链路、统一治理口径,并降低开发与运维复杂度。用户在一个系统中即可同时承载事务处理、实时分析、AI工作负载——企业无需再为交易库、数仓、搜索引擎、向量库、数据湖分别维护独立的链路。

在部署方式上,Lakebase提供两种模式:独立部署,或作为智能叠加层部署。
二、TCO降低30%-50%,已在蚂蚁阿福、灵光落地验证
Data Studio是构建在LakeBase之上的统一数据开发与治理平台。其核心任务是确保LakeBase的数据能力能够顺畅地交付给上层应用,降低复杂数据开发与治理的门槛。它覆盖从数据集成到资产化的全生命周期,依托底层统一存储与多模态处理能力,加速数据服务化与AI应用落地。
Data Pilot则是面向更广泛业务分析场景的数据智能Agent,帮助企业在已有数据集上快速构建面向业务团队的分析能力。其技术优势包括自动化语义网络生成、自然语言驱动的下钻与关联分析。业务分析师能够更快洞察业务变化,做出更及时的决策。
在智驾场景中,OceanBase Lakebase的通义多模态数据底座,将海量智驾数据转化为可管理、可搜索、可分析、可复用的数据资产,显著提升了数据处理效率与精准度。

在证券行业,OceanBase AI数据库统一移动数据源并进行多模态智能解析,能够分析行业研究报告,对监管制度、合规文件进行分类、提取摘要等。

杨传辉分享了一个关键数据:在相关场景中,OceanBase AI数据库可使项目整体TCO降低30%-50%。目前,该方案已在蚂蚁阿福、灵光等场景完成业务验证。
结语:OceanBase具备落地验证和技术优势
三款产品叠加在一起,实际上勾勒出了OceanBase对AI时代数据基础设施的演进路径:数据不只是被存储,更要能被理解、被调用、被Agent自主使用。而OceanBase的AI数据库,天生具备落地优势——支付宝AI支付、蚂蚁阿福、灵光,以及通义千问、高德、飞猪等阿里生态业务,都为其提供了真实、大规模的业务实践场景。可以说,这次AI数据库的推出,是OceanBase十五年技术演进水到渠成的结果。
