首页 游戏 软件 资讯 排行榜 专题
首页
AI
斯坦福AI实现重大突破:三步循环法让计算机理解世界

斯坦福AI实现重大突破:三步循环法让计算机理解世界

热心网友
17
转载
2025-09-28

斯坦福大学NeuroAI实验室在人工智能领域取得重大突破,其开发的"概率结构整合"(PSI)系统开创性地模仿了人类认知机制。这项发表于arXiv(论文编号arXiv:2509.09737v1)的研究成果,展示了系统在理解现实世界方面的多维度能力——能够同时处理空间关系、运动轨迹和场景逻辑,与只能执行单一任务的传统AI形成鲜明对比。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

以日常生活场景为例,当人们看到滚动的球时,不仅知道它在哪,还能判断它会滚向哪儿、可能碰到什么。这种综合认知正是现有AI的软肋。传统模型要么只能认图,要么只能生图,对真实世界的理解支离破碎。斯坦福团队通过打造类似"万能工具箱"的系统,让机器不仅能看见当前场景,还能预测后续发展,进而提炼出世界运行的深层规律。

三阶段认知循环机制

PSI系统的运作原理基于三个递进阶段:首先是"预测",像侦探推理一样罗列各种可能性;接着"挖掘",从这些预测中提炼物体运动和空间关系等规律;最后"吸收",把这些新发现变成系统知识库的一部分。研究人员用1.4万亿个视频片段训练后,系统不仅能预测后续画面,还能提取光流、景深等专业视觉指标。

突破性的预测能力

PSI系统最具革命性的是其"不做确定"的预测方式。采用"局部随机访问"技术,它能像人类一样从任意切入点展开联想。比如给张街景照片,可以生成各种可能发生的场景;看到视频开头几秒,能预测符合物理常识的后续发展。更难得的是,系统会主动告知"我不确定"的情况,这种诚实反而让结果更可靠。

智能推理新境界

系统展现的推理能力令人惊叹。它会在图像上放置虚拟跟踪点,通过对比实验来精确计算每个像素的运动轨迹。分割物体时,通过移动图像局部来寻找边界,完全不用人工标注。测算物体远近时,模拟相机微移就能判断,准确度全球领先。

不断进化的AI大脑

系统最惊艳的地方是会自己长本事——把新发现的知识变成"词汇"融入认知体系。这让它的控制方式从修修补补像素,提升到直接指挥物体运动。更产生了计算"运动概率"等超能力,比如判断静止画面里哪些东西可能会动,这对服务机器人预判环境尤其珍贵。

实际应用表现

在视频编辑测试中,系统能理解保龄球的物理特性,用户调整球路后自动生成合理的碰撞效果。机器人拿到一张照片就能区分什么东西能碰、什么不能碰。玩"抽积木"游戏时,它会模拟拿走每块积木的后果。最厉害的是单视角生成多角度画面,连物体遮挡都处理得天衣无缝。

技术上的六大创新

一是通用架构,一个系统干多种活;二是灵活处理,不按顺序也行;三是概率输出,给多种可能性;四是零样本学习,没教过也能做;五是自我优化,越用越聪明;六是预测能力,见微知著。

挑战与未来

目前训练需要超级计算机是最大门槛,但硬件发展会解决。系统现在还只会找预设的规律类型,未来要进化到自主发现新规律。处理长时间序列和高级概念也还需加强。不过这套方法论理论上能用于声音、文字等领域,前景广阔。

研究人员强调,PSI系统的真正价值在于:不仅看得见,更学着懂。传统AI需要为每个任务单独训练,而PSI的统一架构和进化能力,可能引领AI走向真正类人智能的新纪元。虽然现在主要在视觉领域大展身手,但潜在影响将辐射整个人工智能发展进程。

来源:https://www.itbear.com.cn/html/2025-09/970965.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

豆包上线视频通话功能:支持实时互动 融合视觉语言输入能力
AI
豆包上线视频通话功能:支持实时互动 融合视觉语言输入能力

豆包上线视频通话功能:支持实时视频问答 最近,豆包官方放出了一个大消息:App正式上线了实时视频通话功能。这可不是简单的功能叠加,它实实在在地将用户交互体验,带进了一个全新的维度。 那么,这个新功能具体能做什么?简单来说,当你在豆包的电话界面开启视频画面,你面前的就不再是一个冷冰冰的聊天窗口了。豆包

热心网友
04.14
苹果即将向开发者开放其 AI 引擎,提升应用开发能力
AI
苹果即将向开发者开放其 AI 引擎,提升应用开发能力

苹果的AI新棋局:向开发者敞开设备端智能的大门 科技圈最近有个消息传得挺热:苹果正计划在2025年的全球开发者大会(WWDC)上,向第三方开发者开放其设备端AI模型。这步棋的目的很明确,就是要激发一波应用创新,并扩展其智能生态的边界。具体来说,苹果正在开发一个软件开发工具包(SDK),这个工具包将允

热心网友
04.14
OpenAI联合创始人:AI智能体十年内难堪大用,“智能体之年”言过其实
AI
OpenAI联合创始人:AI智能体十年内难堪大用,“智能体之年”言过其实

OpenAI联合创始人:AI智能体十年内难堪大用,“智能体之年”言过其实 最近,OpenAI的联合创始人安德烈·卡帕西(Andrej Karpathy)给出了一个颇为清醒的判断。他公开表示,我们今天谈论的AI智能体,距离真正意义上的“功能完善”,还有很长一段路要走。 话说回来,他的观点非常直接:眼下

热心网友
04.14
王者荣耀世界充值比例详解王者荣耀世界氪金机制与性价比分析
游戏攻略
王者荣耀世界充值比例详解王者荣耀世界氪金机制与性价比分析

《王者荣耀世界》:付费机制革新,从“数值碾压”到“个性表达” 随着《王者荣耀世界》正式上线,其独特的付费设计理念引发了广泛关注。一个明确的趋势是,这款游戏并未延续传统网游依赖数值付费的陈旧模式。其核心设计逻辑,旨在构建一个以深度叙事与自由探索为核心的开放世界。在此框架下,付费机制的角色发生了本质性转

热心网友
04.14
win10如何安装Redis数据库_win10Redis数据库的6种方式
系统平台
win10如何安装Redis数据库_win10Redis数据库的6种方式

Windows 10 安装 Redis 的六种方法详解 在 Windows 10 操作系统上安装 Redis 数据库,许多开发者会遇到官方不再提供原生 Windows 版本支持的难题。常见问题包括命令无法识别、Windows 服务注册失败或配置文件加载错误。这些问题通常源于版本兼容性、系统环境变量配

热心网友
04.14