首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
科学家打造AI通用大脑:未来愿景与实践

科学家打造AI通用大脑:未来愿景与实践

热心网友
38
转载
2026-02-10

来源:光明日报

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

【前沿科技观察】

本报北京2月9日讯(记者晋浩天)

你可能已经用过智能助手聊天,也见识过人工智能生成的精美图像,看过机器人跳舞……但你是否想过,驱动“聊天”“画画”“运动”的,究竟是三套独立的系统,还是同一个“智能大脑”的三种功能?近日,由北京智源人工智能研究院主导的一项重要科研突破在国际学术期刊《自然》发表,为实现真正“看得清、想得通、做得稳”的通用人工智能指明了新方向。这也是我国科研机构主导的大模型原创成果首次在《自然》正刊发表。

论文主要作者、北京智源人工智能研究院理事长、北京大学教授黄铁军指出,这项研究的核心思想非常简洁:以统一架构,让AI学会“接龙”。“无论是阅读文字、欣赏图片,还是观看视频、生成动作,在我们新开发的智源Emu模型的‘眼’里,都被转换成一‘数字积木’。模型的任务,就像我们玩歌词接龙游戏那样,始终预测‘下一块积木’应该如何出现。”

“这一思路有迹可循。早在2018年,美国OpenAI公司便基于‘预测下一词’的路线训练GPT模型,并于近日推出ChatGPT,实现了语言大模型重大突破。”黄铁军团队推测,“预测下一词”的架构或许不仅适用于语言,也能拓展至多种模态,将图像、文本和视频数据在同一架构下统一训练,从而开发出“一脑多能”的多模态大模型。

团队成员介绍,此前全球范围内出现的此类模型,大多采用“专用工具组合”方式:理解语言与图片、生成图片与视频,均由各自独立的模型或工具各司其职。这类分工模式虽目的明确,但协同成本也随之增加。能否训练一个“通才”,采用统一架构处理各类数据、掌握多种技能?研究团队的Emu3模型给出了肯定答案。

Emu3正是这样一个“通才”型AI:当你给它一段文字描述时,它可以生成细节丰富、结构合理的图像;当你给它一张照片及相关问题时,它又能结合视觉信息与常识,进行精准的图像问答与理解;更进一步,它还能生成连续的视频片段——只需给出一个开头,模型便能一帧一帧地输出后续画面,甚至还能像连环画那样,为每段画面配上文字描述。

在升级版Emu3.5中,研究团队通过引入大规模长时序视频训练,使模型从“预测下一个词元”拓展到“预测下一个状态”,开始学习世界随著时间演化的统计规律,为迈向更完整的“世界模型”探索了可行路径。

黄铁军表示,这意味着,多模态模型分离的“理解”和“生成”两类能力,首次在同一种简单而统一的建模范式下被系统性打通。

这把“统一建模”的钥匙,其潜力并不止于多模态内容生成。它可以延伸到物理世界,为机器人操作提供可行的动作序列设想,还可以解读脑信号等各种复杂数据。黄铁军介绍,“预测下一个”这一看似朴素的思想,本身蕴含着构建通用智能的基因。《自然》编辑评价,智源Emu3这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

黄铁军表示,这项成果证实了生成式人工智能技术路线的普适性:人类已经掌握了让不同智能在同一体系内涌现的方式,正稳步走上通用人工智能持续演进的道路。

来源:https://www.163.com/dy/article/KLD6623O0514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国产机器人突破“身强脑弱”:大湾区发布4项智脑技术成果
科技数码
国产机器人突破“身强脑弱”:大湾区发布4项智脑技术成果

3月27日,“人形机器人AI软硬件生态融合工作组工作推进会暨首届具身智脑技术生态大会”上海大零号湾科创大厦举行。作为本次大会的核心亮点,灵境智源集中发布四项自主研发的具身智脑核心技术成果,覆

热心网友
03.27
上海AI研究院突破机器人手巧难题,攻克两大智能瓶颈
科技数码
上海AI研究院突破机器人手巧难题,攻克两大智能瓶颈

位于剑川路930号的4层小楼里入驻的是上海人工智能研究院,记者每次走访它都会有惊喜。两年前,他们孵化的一家机器人企业一年被资本“追投”7轮,如今他们又培养出两家在具身智能赛道熠熠闪光的明星企业——灵

热心网友
03.16
FlagOS适配优化:曦望与智源研究院众智平台完成协作
科技数码
FlagOS适配优化:曦望与智源研究院众智平台完成协作

北京商报讯(记者 陶凤 王天逸)2月11日,曦望Sunrise宣布,近期完成了与北京智源人工智能研究院众智 FlagOS 体系中 FlagTree 统一编译器及 FlagGems 算子库的适配与优化

热心网友
02.11
科学家打造AI通用大脑:未来愿景与实践
科技数码
科学家打造AI通用大脑:未来愿景与实践

来源:光明日报【瞧!我们的前沿科技】本报北京2月9日电(记者晋浩天)你也许用过智能助手聊天,也见过人工智能(AI)生成精美图像,看过机器人跳舞……但你是否想过,驱动“聊天”“画画”“运动”的,究竟是

热心网友
02.10
我国首个大模型成果登上《自然》封面背后的突破
科技数码
我国首个大模型成果登上《自然》封面背后的突破

本报讯(记者雷嘉)近日,北京智源人工智能研究院的多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊《自然》,预计2月12日纸质版正式刊发,这是我国科研机构主导的大

热心网友
01.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

山寨币与主流币的五大核心区别及投资策略
web3.0
山寨币与主流币的五大核心区别及投资策略

主流币与山寨币在市值、技术、共识和风险上差异显著。主流币市值巨大、流动性强,技术经过长期验证,拥有全球共识和明确应用场景,适合长期配置。山寨币则市值小、流动性差,技术基础薄弱且缺乏审计,共识脆弱且多依赖炒作,价格波动剧烈且归零风险高,属于高风险投机标的。

热心网友
05.12
Bitget身份认证攻略:提升证件清晰度与缩短审核时间,快速通过验证
web3.0
Bitget身份认证攻略:提升证件清晰度与缩短审核时间,快速通过验证

进行Bitget身份认证时,除了正确上传照片,证件本身的清晰度至关重要。模糊、反光或信息不全的图片会直接导致审核失败。此外,认证申请提交后的等待时间受平台审核队列、资料完整度及网络状况等多重因素影响,高峰期可能延长。建议用户确保在光线均匀环境下拍摄高清证件照,并耐心等待系统处理,以提升一次性通过率。

热心网友
05.12
Bitget交易所下载全攻略:安卓、iOS与网页端详细安装教程
web3.0
Bitget交易所下载全攻略:安卓、iOS与网页端详细安装教程

本文详细介绍了Bitget交易所在不同设备上的下载与访问方法。安卓用户可通过官方应用商店或APK文件安装,需注意权限设置。iPhone用户需切换至非中国大陆AppStore账户下载官方App。网页端则提供最直接的访问方式,无需安装,但务必核对网址安全性。文章还补充了常见问题与安全建议,帮助用户顺利完成平台使用前的准备工作。

热心网友
05.12
Bitget新手教程:从注册到首笔交易完整指南
web3.0
Bitget新手教程:从注册到首笔交易完整指南

对于初次接触Bitget的新用户,从注册到完成第一笔交易,平台提供了一条清晰的操作路径。关键在于完成账户注册与安全设置,包括身份验证和资金密码。随后,通过法币入金通道为账户注入启动资金,并熟悉现货交易界面的基本操作。最后,在模拟交易中实践后,即可尝试小额真实交易,完成从入门到实操的完整闭环。

热心网友
05.12
Bitget新手入门指南:掌握6个核心页面位置轻松上手交易
web3.0
Bitget新手入门指南:掌握6个核心页面位置轻松上手交易

对于初次接触Bitget这类专业交易平台的新用户来说,感到无从下手是普遍现象。关键在于熟悉核心功能区的布局,特别是资产总览、现货交易、合约交易、资金划转、订单管理和个人设置这六个关键页面。掌握它们的位置和基本逻辑,就能快速理清平台操作脉络,大幅提升使用效率,避免在基础操作上耗费过多时间。

热心网友
05.12