假设有一天,AI智能体们开始像人类一样组建社会、分工协作,甚至发展出属于自己的文明——这听起来像是科幻电影里才会出现的情节,但Altera的Project Sid正在把这变成现实。而更关键的是,他们希望构建的智能体,能够超越表层的训练过程,去呈现人类的价值观。

Project Sid:真·自主AI智能体
构建一个由AI智能体组成的文明会是什么样子?我们距离《西部世界》还有多远?以及,我们能否让AI文明与人类文明保持对齐?在团队看来,Sid就是探索这些问题的第一步——最终目标是将数字人无缝整合到人类社会中。

这里所说的“真正自主的智能体”,特指具备以下四种特质的AI:
- 长期自主:能够独立运作数小时甚至数天(可不是那种只调用一次函数的“智能体”)。
- 组织性:能够相互协作以达成个体无法完成的任务(而不是简单地给1000个客户配1000个独立智能体)。
- 亲人类动机:拥有支持人类的深刻且强大的驱动力(而不是只懂得乖乖听话的机器)。
- 有意识的沟通:能够用言语表达它们有意识的思想和感受(而不是只会条件反射式应答的机器人)。
为什么这些特质在我们迈向下一个AI水平时显得尤为重要?原因非常直接:
- 人类不可能像对待ChatGPT或Claude那样,对每一个AI智能体都事无巨细地管理——它们必须更加自主。
- 那么,我们该如何信任它们的自主决策?它们不能仅仅被训练成模仿人类,最深层的动机必须与人类的价值观相一致。
- 它们不仅需要能够交流,而且话语必须充分反映出内心的真实想法和决定。
- 随着AI智能体成为人类文明的一部分,它们必须能有效地与彼此以及我们其他人协作。
创新
一直以来,游戏(比如《我的世界》)都是测试新兴技术的绝佳试验场。在游戏里,智能体行为的可靠性并不是硬性要求——事实上,不可预测性甚至可以成为一个特点而非缺陷,这让研究人员能更快地测试、迭代和发布。相比之下,生产力工具和辅助工具则需要更高的可靠性。

在开发Sid的过程中,团队采用了多项创新来提升智能体的社交能力、觉知能力和内部心理过程。
1. 对话
就像人与人之间的交流一样,智能体之间的对话不仅取决于它们之前说过的话,还取决于它们之间的关系。为了实现真实的对话,团队在智能体的行为中构建了社会世界模型——智能体会形成并更新关于其他智能体的模型(包括它们的行为、观点和需求),并利用这些信息在社交环境中进行对话和行动。同时,智能体应该能出于多种原因进行交流:表达意图、闲聊、分享希望和梦想。为此,团队构建了一组对话模块,一方面让智能体的言语与行动和意图保持一致,另一方面也让它们可以谈论与现实脱节的想法。

2. 强大的目标和意图管理
有组织的心理过程能支持智能体的社交行为和决策,让它们考虑正在发生的事件和活动。例如,团队为智能体提供了跟踪进行中活动并将这些事件整合成简明记忆的能力——这对于减少无限行动循环(智能体长期以来的一个老问题)至关重要。同时,为了让智能体能灵活调整行为来处理目标,团队还赋予了它们丰富的精神生活,这种精神生活与即时的感官和运动反应相分离。智能体可以在这种精神生活中推理、反思,甚至生成或改变目标,以适应快速变化的环境。
架构
既然“大脑”是唯一经过验证的人类级智能体模型,团队提出了一种全新的“系统神经科学复合架构”。在这个架构中,模型会模拟前额叶皮层、记忆系统、社会情感状态等关键脑区功能。


挑战
和其他任何第一次尝试一样,Sid项目提出的问题远比它能够解答的要多:
- 如何以通用的方式有意义地衡量真正的长期进展?
- 如何构建真正关注人类发展的智能体?
- 如何构建对自己的行为及其后果具备意识的机器?
- AI文明可以被扩展到多大规模?
举个例子:
- 难以对文明进行评估:在《我的世界》中,团队使用了技术/工具进步、贸易活动、健康和协调/协作任务来评估社会进步。但每个评估只能捕捉社会的某些侧面,单纯优化一个方面可能会导致其他方面失衡。
- 目标驱动的自主性和协作存在冲突:高效的技术进步在较少沟通且高度目标导向的智能体中效果最好。但如果智能体过于偏向完成自己的目标,就会在需要灵活和动态目标设定的协作任务中失败。因此,智能体需要在保持内部目标驱动的同时,关注社会影响和动机。

- 单个智能体的缺陷会导致逐渐偏离最初目标的行动:在一个场景中,老板将任务(比如制作铁镐)委派给经理,经理再委派给工人,团队成功需要每个成员有效沟通自己的目标,并在社会层级中上下委派责任。任何一个环节的失误都可能引发连锁偏离。
总的来说,要回答这些问题,还需要超越当前范式的研究和工程实践。
北大校友创业,打造有同理心AI
Robert Yang

Robert Yang是Altera的联合创始人兼CEO。他曾在纽约大学和耶鲁大学获得计算神经科学博士学位,在北大获得物理学学士学位。

他曾是MIT脑与认知科学系和电子工程与计算机科学系教授,以及MIT MetaConscious小组负责人。2023年,他关闭了实验室,离开了麻省理工学院的终身教职,创立了Altera。

Altera的团队虽小,但人才密度极高——由来自MIT电子工程与计算机科学系、斯坦福自然语言处理小组、Google X、Citadel、Supercell等机构的计算神经科学家、物理奥林匹克选手和工程师组成。

这家成立半年多的公司,年初获得了200万美元的种子融资,由Andreessen Horowitz领投。三个月后,又再次融资900万美元,由谷歌前CEO埃里克·施密特的First Spark Ventures、Patron VC、天使投资人Mitch Lasky等领投。今年5月,Altera在Menlo Park设立了分店,并致力于成为首家智能体消费产品的供应商。
数字人会取代人类吗?
正如理查德·费曼所说:“凡我不能创造的,我就不能理解。”创造数字人正是理解人性的一种方式——不仅要在个体层面理解,还必须通过群体、社会和文明的视角来观察。那么,数字人类会取代真实的人类吗?答案是——不会。在团队看来,数字人是为了增强人类,而不是取而代之。

随着智能体交互质量的提高,文明的质量也会相应提高。当突破某一关键阈值时,就会发生质变——正如语言模型大到一定程度时会“涌现”一样,届时智能体文明将不仅能够自我维持,还能自我改进。到那时,我们或许就可以拥抱一个数字人重新定义人类能力极限的世界了。
