OceanBase发布AI数据库:一套引擎融合湖库与多模态数据
速览
OceanBase正式推出AI数据库产品,旨在解决企业数据孤岛问题。该产品通过一套统一引擎实现湖仓一体与多模态数据的融合处理。此举有助于让AI更精准地“读懂”企业数据,提升智能化应用效率。
AI 深度解读
背景
过去三年,尽管大模型能力快速跃升且算力持续突破,但企业级 AI 落地并未迎来预期中的价值释放。行业共识逐渐形成:AI 竞争的焦点正从“模型”转向“数据”。随着 Agent(智能体)进入系统执行层,企业数据走向多模态化,传统多系统协同的架构难以满足 AI 对“统一上下文”的要求。
在此背景下,AI 正在改变数据的管理范式。Agent 的引入带来了“规模、上下文和进化”三大关键挑战,导致数据形态、流动和交互方式发生巨变。然而,数据库在一致性、扩展性、可靠性和实时性方面的底线不可退让。因此,重写架构成为必然,而“湖库一体”被视为解决这一矛盾的最佳路径。
核心内容
6月29日,OceanBase 正式发布面向 AI 时代的湖库一体 AI 数据库。该方案提出以湖库一体为核心架构,将数据湖的开放与海量存储能力、数据库的事务处理与分析能力,以及多模态数据处理能力,统一到底层强一致的数据底座上。其核心目标是帮助 Agent 一次获取完整的业务上下文,让 AI 真正“读懂”企业。
围绕这一核心能力,OceanBase 构建了覆盖数据引擎、数据治理与业务入口的完整产品体系:
- OceanBase Lakebase:作为底层引擎,负责在统一架构中管理、加工、检索和调用结构化数据、非结构化数据和向量数据,解决 AI 时代的数据底座问题。
- OceanBase DataStudio:运行在 Lakebase 之上,覆盖数据接入、加工、编排、语义建模到 Agent 协作等环节,旨在将分散的数据资产转化为可调用的数据服务,解决数据治理与服务化问题。
- OceanBase DataPilot:作为统一的企业业务智能入口,允许业务人员通过自然语言完成分析报告、数据看板和可信答案生成,解决业务人员直接使用数据智能的问题。
据 OceanBase 介绍,相较传统多系统方案,该 AI 数据库可降低整体 TCO(Total Cost of Ownership,总体拥有成本)约 30%-50%。目前,该能力已在蚂蚁集团内部的“阿福”及外部“灵光”等 AI 场景完成业务验证。其中,“灵光”累计生成数千万个“闪应用”,验证了湖库一体架构在千万级 Agent 场景下的可行性。
OceanBase CTO 杨传辉强调,真正的一体化必须发生在架构层,而非简单的拼接。OceanBase 选择从数据库内核出发,将长期在金融核心系统中验证的事务一致性、高可用与弹性能力,延伸至湖与多模态数据体系之上,实现从底层出发的重构。
关键要点
- 架构革新:采用湖库一体架构,在同一套引擎中统一管理多模态数据,打通在线与离线处理,消除多系统割裂。
- 产品矩阵:形成由 Lakebase(数据引擎)、DataStudio(数据治理与服务化)、DataPilot(业务智能入口)组成的全栈产品体系。
- 成本优势:相比传统多系统方案,整体 TCO 降低 30%-50%。
- 实战验证:已在蚂蚁“阿福”和“灵光”场景落地,灵光累计生成数千万个“闪应用”,验证了千万级 Agent 场景下的可行性。
- 技术路径:从数据库内核出发,而非在旧架构上叠加修补。依托 OceanBase 在金融级场景中锤炼出的数据不出错、系统不中断、故障毫秒恢复能力,支撑 AI 负载。
- 市场地位:OceanBase 是中国自主研发的数据库,已服务超 400 家金融机构,连续两年位居中国分布式数据库本地部署市场第一,也是迄今唯一同时登顶 TPC-C 和 TPC-H 两项国际权威测试的数据库。
意义与影响
AI 数据库正在成为全球基础软件的新赛道,但技术路径尚未收敛。OceanBase 的发布标志着国产厂商在 AI 数据库范式重构中迎来了新的窗口期。
- 从“记录事实”到“参与决策”:随着 Agent 成为数据库的新使用者,数据库的角色正在发生根本性转变,从被动记录转向主动参与决策,成为 AI 时代新的基础设施形态。
- 重新定义数据范式:AI 数据库不再仅仅是传统数据库的能力扩展,而是重新定义了数据如何被 AI 组织、调用与决策。差异的本质在于对“AI 如何使用数据”的不同理解。
- 参与规则制定:长期以来,基础软件标准主要由国际厂商定义。在 AI 数据库规则尚未固化的阶段,OceanBase 有机会从“跟随者”走向“共同定义者”,参与新体系的形成。这不仅是 OceanBase 的机遇,也是中国基础软件产业参与全球竞争的重要契机。
