首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
科学家打造AI通用大脑:未来愿景与实践

科学家打造AI通用大脑:未来愿景与实践

热心网友
67
转载
2026-02-10

来源:光明日报

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

【前沿科技观察】

本报北京2月9日讯(记者晋浩天)

你可能已经用过智能助手聊天,也见识过人工智能生成的精美图像,看过机器人跳舞……但你是否想过,驱动“聊天”“画画”“运动”的,究竟是三套独立的系统,还是同一个“智能大脑”的三种功能?近日,由北京智源人工智能研究院主导的一项重要科研突破在国际学术期刊《自然》发表,为实现真正“看得清、想得通、做得稳”的通用人工智能指明了新方向。这也是我国科研机构主导的大模型原创成果首次在《自然》正刊发表。

论文主要作者、北京智源人工智能研究院理事长、北京大学教授黄铁军指出,这项研究的核心思想非常简洁:以统一架构,让AI学会“接龙”。“无论是阅读文字、欣赏图片,还是观看视频、生成动作,在我们新开发的智源Emu模型的‘眼’里,都被转换成一‘数字积木’。模型的任务,就像我们玩歌词接龙游戏那样,始终预测‘下一块积木’应该如何出现。”

“这一思路有迹可循。早在2018年,美国OpenAI公司便基于‘预测下一词’的路线训练GPT模型,并于近日推出ChatGPT,实现了语言大模型重大突破。”黄铁军团队推测,“预测下一词”的架构或许不仅适用于语言,也能拓展至多种模态,将图像、文本和视频数据在同一架构下统一训练,从而开发出“一脑多能”的多模态大模型。

团队成员介绍,此前全球范围内出现的此类模型,大多采用“专用工具组合”方式:理解语言与图片、生成图片与视频,均由各自独立的模型或工具各司其职。这类分工模式虽目的明确,但协同成本也随之增加。能否训练一个“通才”,采用统一架构处理各类数据、掌握多种技能?研究团队的Emu3模型给出了肯定答案。

Emu3正是这样一个“通才”型AI:当你给它一段文字描述时,它可以生成细节丰富、结构合理的图像;当你给它一张照片及相关问题时,它又能结合视觉信息与常识,进行精准的图像问答与理解;更进一步,它还能生成连续的视频片段——只需给出一个开头,模型便能一帧一帧地输出后续画面,甚至还能像连环画那样,为每段画面配上文字描述。

在升级版Emu3.5中,研究团队通过引入大规模长时序视频训练,使模型从“预测下一个词元”拓展到“预测下一个状态”,开始学习世界随著时间演化的统计规律,为迈向更完整的“世界模型”探索了可行路径。

黄铁军表示,这意味着,多模态模型分离的“理解”和“生成”两类能力,首次在同一种简单而统一的建模范式下被系统性打通。

这把“统一建模”的钥匙,其潜力并不止于多模态内容生成。它可以延伸到物理世界,为机器人操作提供可行的动作序列设想,还可以解读脑信号等各种复杂数据。黄铁军介绍,“预测下一个”这一看似朴素的思想,本身蕴含着构建通用智能的基因。《自然》编辑评价,智源Emu3这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

黄铁军表示,这项成果证实了生成式人工智能技术路线的普适性:人类已经掌握了让不同智能在同一体系内涌现的方式,正稳步走上通用人工智能持续演进的道路。

来源:https://www.163.com/dy/article/KLD6623O0514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国产机器人突破“身强脑弱”:大湾区发布4项智脑技术成果
科技数码
国产机器人突破“身强脑弱”:大湾区发布4项智脑技术成果

3月27日,“人形机器人AI软硬件生态融合工作组工作推进会暨首届具身智脑技术生态大会”上海大零号湾科创大厦举行。作为本次大会的核心亮点,灵境智源集中发布四项自主研发的具身智脑核心技术成果,覆

热心网友
03.27
上海AI研究院突破机器人手巧难题,攻克两大智能瓶颈
科技数码
上海AI研究院突破机器人手巧难题,攻克两大智能瓶颈

位于剑川路930号的4层小楼里入驻的是上海人工智能研究院,记者每次走访它都会有惊喜。两年前,他们孵化的一家机器人企业一年被资本“追投”7轮,如今他们又培养出两家在具身智能赛道熠熠闪光的明星企业——灵

热心网友
03.16
FlagOS适配优化:曦望与智源研究院众智平台完成协作
科技数码
FlagOS适配优化:曦望与智源研究院众智平台完成协作

北京商报讯(记者 陶凤 王天逸)2月11日,曦望Sunrise宣布,近期完成了与北京智源人工智能研究院众智 FlagOS 体系中 FlagTree 统一编译器及 FlagGems 算子库的适配与优化

热心网友
02.11
科学家打造AI通用大脑:未来愿景与实践
科技数码
科学家打造AI通用大脑:未来愿景与实践

来源:光明日报【瞧!我们的前沿科技】本报北京2月9日电(记者晋浩天)你也许用过智能助手聊天,也见过人工智能(AI)生成精美图像,看过机器人跳舞……但你是否想过,驱动“聊天”“画画”“运动”的,究竟是

热心网友
02.10
我国首个大模型成果登上《自然》封面背后的突破
科技数码
我国首个大模型成果登上《自然》封面背后的突破

本报讯(记者雷嘉)近日,北京智源人工智能研究院的多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊《自然》,预计2月12日纸质版正式刊发,这是我国科研机构主导的大

热心网友
01.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Clusterly AI
AI
Clusterly AI

Clusterly AI是什么 在内容创作领域,效率和质量常常难以兼得,而一款名为Clusterly AI的工具,正试图打破这个僵局。它由Clusterly公司开发,本质上是一个专为提升在线可见性而生的智能内容引擎。无论是内容创作者、独立博主,还是企业营销团队,都可以借助它快速生产出那些搜索引擎青睐

热心网友
04.20
海尔燃气热水器连不上wifi怎么办
电脑教程
海尔燃气热水器连不上wifi怎么办

海尔燃气热水器Wi-Fi连接失败?别慌,这通常不是机器故障 当您发现海尔燃气热水器无法连接Wi-Fi时,请不要急于联系售后维修。根据海尔官方技术报告与售后大数据分析,超过90%的联网问题并非热水器硬件损坏,而是由于网络配置步骤存在疏漏,或家庭无线网络环境未满足设备接入的特定要求。只要您能准确识别并避

热心网友
04.20
Ellmo Genzers
AI
Ellmo Genzers

Ellmo Genzers是什么 说起企业级的AI应用工具,现在市面上选择不少,但真正能把数据安全、功能实用和多语言支持这三件事同时做好的,其实并不多。今天要聊的Ellmo Genzers,就是由GenZ Technologies推出的一款专为组织设计的语言模型操作平台。它的目标很明确:帮助企业安全

热心网友
04.20
广交会“老面孔”汪和平:二十载坚守,见证中国外贸“破茧成蝶”新征程
科技数码
广交会“老面孔”汪和平:二十载坚守,见证中国外贸“破茧成蝶”新征程

在第139届广交会的展馆内 浙江诺特电器创始人汪和平的展位,面积不过十平方米,却总是围满了人。他正用一台双屏翻译机,和一位印度客商流畅地交流着产品细节。这位在饮水机外贸行业摸爬滚打了二十多年的企业家,早已习惯用科技工具打破沟通壁垒,再用差异化的产品,牢牢抓住全球采购商的目光。 时间拉回到2004年,

热心网友
04.20
松下按摩椅产地是泰国还是马来西亚?
电脑教程
松下按摩椅产地是泰国还是马来西亚?

松下按摩椅究竟是泰国制造还是马来西亚生产? 首先明确核心信息:松下按摩椅的主要生产基地在泰国,同时马来西亚工厂也承担部分型号的区域化组装任务。根据松下电器官方公布的全球制造布局,其东南亚地区的核心产能确实集中于泰国工厂。该生产基地自2010年代初期投入运营以来,一直负责中高端按摩椅系列的研发试制与批

热心网友
04.20