过去两年间,围绕人工智能的讨论几乎完全被大模型本身所主导——模型的性能有多强劲,迭代速度有多惊人。然而,一个更为根本的问题往往被忽视了:这些大模型所依赖的数据,其质量究竟如何?

在金融服务领域,数据始终是风险管理与洞察生成的核心要素。这一点从未改变。AI带来的真正变革在于:它让数据策略中的缺陷暴露得更加迅速。假如数据所有权不清晰,某个系统定义“风险敞口”,另一个系统也标称“风险敞口”,但口径却截然不同——AI不仅不会帮你弥合分歧,反而会第一时间将这些漏洞放大呈现。这正是贝莱德AI战略的基石:并非从模型起步,而是从更基础的层面着手——数据所有权与语义一致性。
许多组织内部,数据是作为应用程序和工作流程的副产品逐渐堆积而成的。这些“排放物”被存储、转换并生成报表,但随着时间的推移,业务上下文不断流失,定义开始发生漂移,责任归属也变得模糊不清。经验丰富的分析师尚能凭借直觉与机构知识填补这些空白,但机器却无法做到。当AI系统需要对同一资产进行推理时,这种模糊性将直接导致灾难性后果。
因此,要让AI系统可靠运行,首先必须确保数据拥有明确的所有权、完整的血缘记录,以及一致的语义定义。贝莱德的策略是:将数据视为产品,而非副产品。这意味着:有专人对其负责,治理机制从最初就嵌入其中,数据的设计从一开始就考虑可复用性——不仅为某一特定报表服务,而是要支撑所有工作流程,包括AI驱动的部分。
值得关注的是,在推行这一理念的过程中,一个关键决策是:标准化,但不集中化。
在受监管行业中,面对复杂性的本能反应往往是整合——把所有内容塞进一个数据仓库,实施集中管控。这固然能加强监督,但也容易拖慢业务前线的节奏,使数据离最懂它的人越来越远。贝莱德选择了联邦模式:业务团队与产品团队对自己产出的数据产品保持最终责任,因为他们最贴近这些数据所支撑的投资流程。这一点至关重要——数据不是被“收走”管理,而是被“授权”管理。
而Snowflake在其中的角色,是在这套联邦架构下提供标准化的能力:以一致的方式进行数据保护、共享与审计。强大的基于角色的访问控制与原生的数据共享,使整个公司在保持互操作性的同时,能够灵活扩展规模,而不必每一项决策都等待集中化小组批准。
这种平衡,在Aladdin数据云的交付方式上也得到了体现。过去,分发数据通常依赖平面文件、FTP传输以及大型模式定义。虽然可以运行,但效率完全无法满足今天的需求。如今,客户能够以现代化、云原生的方式,将自己的记录账簿和市场数据直接集成到更广泛的数据资产中。这才算真正进入状态。
在金融领域,治理是不能后期“打补丁”的。随着数据平台持续迭代,贝莱德对元数据与问责制的重视程度极高。平台有一条硬性规则:任何资产,如果没有明确的所有权与来源记录,根本无法进入系统。随着AI驱动的工作流程和自然语言界面逐渐深入日常操作,这种可追溯性只会变得更加重要,而非相反。
AI还让一个更微妙的问题浮出水面:语义一致性。两个系统使用同一个字段名,但含义可能完全不同。例如“交易对手”,在风控系统与前台系统中的口径可能相差甚远。人类能够依靠上下文绕开这类歧义,但AI系统却做不到。如果上下文是隐式的、靠默契传递的,而非显式定义的,系统的可靠性很快就会崩溃。
这也是为什么贝莱德特别关注行业在开放语义交换(OSI)方向上的探索——原因很简单,目标也非常务实:让组织之间不仅能交换数据,还能交换数据背后的含义。一旦语义可移植,每次引入新工具、新模型、新智能体时,就无需重新搭建解释层。在AI驱动的生态系统中,这种互操作性迟早会成为刚需。
随着所有权与共享标准逐渐到位,团队的工作方式也在发生显著变化。花在管理定制传输和拼凑系统上的时间正在减少,更多精力被投入提升数据产品本身的清晰度与实用性。从贝莱德的实践来看,敏捷性与控制力并非矛盾。有了明确的标准与问责制,两者反而能够相互支撑。
市场与技术不会停滞不前。新的资产类别将不断涌现,数据界面的交互方式也会变得越来越直观。为未来做准备,不是盲目追逐下一个模型发布,而是把最基础的东西打磨到极致——数据本身的所有权、治理与清晰含义。
说到底,AI可以加速实现贝莱德的使命——帮助越来越多人体验财务健康。但前提是,底层的数据必须是有主的、有规矩的、能被清楚理解的。
对于任何正在规划AI战略的组织而言,这才是真正需要下功夫的地方。
Q&A
Q1:贝莱德为什么认为AI战略应该从数据所有权和语义开始?
A:因为AI就像一面照妖镜,会迅速放大数据策略中的问题。如果数据所有权不明确,或者不同系统间的定义各说各话,AI系统根本无法可靠运行。贝莱德的做法是把数据当作产品管理,而非当作副产品堆积。谁对数据负责、治理从哪一步开始、数据能否跨工作流复用——这些基础问题比追逐最新的模型重要得多。
Q2:贝莱德在数据管理上采用了什么模式?为什么不直接集中化?
A:贝莱德走的是联邦模式——业务和产品团队对自己管理的数据保持责任,因为他们最了解这些数据背后的投资逻辑。集中化虽然能加强监督,但容易拖慢节奏,让数据和最懂它的人之间产生隔阂。借助Snowflake平台,贝莱德做到了标准化但不集中化,既能保持互操作性,又能保障灵活扩展的能力。
Q3:开放语义交换(OSI)对AI应用意味着什么?
A:OSI解决的是“字段名一样,意思却不同”的问题。两个系统使用同一个字段,但口径或定义完全不同,人能凭经验识别,AI却做不到。语义一旦可移植,每次引入新工具或新模型时,就不需要重新搭建解释层。在AI生态中,这种互操作性直接决定了系统的可靠性,不是“锦上添花”,而是基础能力。
