游乐游手机版
首页/科技数码/文章详情

Meta明年初发布AI视频与图像新模型,研发世界模拟技术

时间:2025-12-19 09:13
社交媒体巨头Meta传出在AI竞争中发力的最新消息,反映其在战略重心从开源模式转向追求前沿盈利模型的转变。美东时间18日周四媒体报道,Meta的首席AI官Alexandr Wang在上周四的内部问答

社交媒体巨头Meta最新披露的动向揭示了其在人工智能竞赛中发力方向的变化,这反映出公司战略重心正从开源模式转向追求前沿盈利模型的重大调整。

美东时间18日周四,媒体援引内部消息称,Meta首席AI官Alexandr Wang在上周四的内部问答会上透露,公司正在开发代号为Mango的新一代图像与视频AI模型,以及代号为Avocado的下一代大语言模型,预计将于2026年上半年正式发布。

Wang表示,Avocado模型的核心目标之一是提升编程能力,同时公司也正处于研究开发世界模型的早期阶段。世界模型是一种能够通过吸收视觉信息来学习并理解环境的AI技术。

这一消息进一步证实了Meta在人工智能领域的战略调整。上周《华尔街见闻》就曾提及,有报道称Meta正在开发名为Avocado的新型前沿AI模型,该模型在训练过程中运用了阿里巴巴的通义千问等第三方模型进行优化,并可能转向采用专有而非开源的发布模式。这与Meta此前主推的开源Llama系列形成了鲜明对比。

为推动AI研发,Meta在今年夏天重组了AI团队,聘请Alexandr Wang领导新成立的超级智能部门Superintelligence Labs。CEO扎克伯格还亲自从OpenAI招募了超过20名研究人员,组建了一支超过50人的AI专家团队。

双模型布局:图像生成与语言能力并进

据本周四的报道,Meta正同步推进两个核心AI模型的开发。图像与视频模型Mango旨在增强Meta在生成式AI领域的竞争力,而文本模型Avocado则专注于提升编程等关键能力。

图像生成已成为各大AI公司竞争的关键战场。

谷歌在今年8月末推出了基于Gemini 2.5 Flash模型的AI图像生成及编辑工具Nano Banana,推动Gemini月活跃用户从7月的4.5亿增长至10月底的超过6.5亿。

Meta则在9月25日推出了与Midjourney合作开发的AI视频生成器Vibes。不到一周后,OpenAI就发布了自己的视频生成应用Sora。

OpenAI CEO Sam Altman在上周与记者会面时强调了AI图像生成对消费者的重要性,称这是许多用户的主要兴趣点,也是让他们持续回访的“粘性”功能。

战略转向:从开源到专有模式

据上周的报道,Meta的AI战略正在发生重大转变。公司内部许多人原本预计Avocado模型会在今年年底前发布,但计划现已推迟到2026年第一季度。

报道称,Avocado可能采用专有模式,这意味着外部开发者无法自由下载其权重和相关软件组件。此举若最终实施,将标志着该公司长期坚持的开源战略发生显著变化,其做法将更接近谷歌与OpenAI等主要竞争对手的模式。

报道指出,这一转变的催化剂之一是Llama 4在4月发布后未能赢得开发者的青睐。此外,中国AI新星DeepSeek发布的R1模型采用了Llama架构的部分内容,这让Meta部分员工感到不满,进一步凸显了开源策略的风险。

扎克伯格去年曾预测Llama系列将成为“业内最先进”的模型,并在今年1月的财报电话会议上专门讨论了Llama。但在10月的最新财报会议上,他仅提及该品牌一次。

Meta今年6月豪掷143亿美元投资Scale AI,并挖来了这家独角兽企业的创始人汪韬。公司在10月末公布三季度报时,将今年的资本支出指引上调至700亿至720亿美元。

世界模型:AI理解物理世界的新前沿

澎湃新闻此前介绍,世界模型的灵感源于人类的世界心智模型。人类通过感官获取的抽象信息在大脑中被转化为对周围世界的具体理解。基于这些模型,大脑对世界进行预测,从而影响感知和行动。

英伟达指出,世界模型是用于理解现实世界动态的神经网络,包括物理属性和空间属性。它们可以使用文本、图像、视频和运动等输入数据来生成模拟实际物理环境的视频,能够为人工智能提供理解真实三维物理世界的能力,对具身智能的实现具有重大意义。

不过,世界模型面临显著的技术挑战。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。世界模型也存在幻觉问题,并会内化训练数据中的偏见。如果这些障碍被克服,世界模型可以为机器人技术和AI决策带来突破,使AI能够对其所处情境形成理解并推理出可能的解决方案。

来源:https://www.163.com/dy/article/KH4FMUOK05198NMR.html
上一篇AirPods Pro 3固件升级后静电噪音仍未修复 下一篇苹果Studio Display屏幕闪烁问题持续,macOS 26.x更新修复未果
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
索尼FX3 II电影机夏末发布 或配双处理器全域快门
科技数码 · 2026-05-30

索尼FX3 II电影机夏末发布 或配双处理器全域快门

索尼FX3II电影机预计夏末发布,或将搭载全新双处理器系统与全域快门,采用BIONZXR2影像处理器、增强型主动散热及色温传感器,保留全机械快门,传感器具体参数尚未确认。

比亚迪城市领航安全兜底加速辅助驾驶普及
科技数码 · 2026-05-30

比亚迪城市领航安全兜底加速辅助驾驶普及

比亚迪在智能驾驶领域再次推出重磅举措。5月29日,其智能化战略发布会上正式宣布,将辅助驾驶安全兜底服务从智能泊车扩展至城市领航——这意味着,搭载天神之眼A或B系统的车型,在合规使用城市领航功能期间发生有责事故,比亚迪将直接承担赔付,不设上限,且不影响次年保费。与此同时,自研的4nm智驾芯片璇玑A3也

英伟达ComputeX大会前发布预告:神秘PC芯片将至
科技数码 · 2026-05-30

英伟达ComputeX大会前发布预告:神秘PC芯片将至

这则消息引发广泛关注。就在ComputeX大会开幕前夕,英伟达在社交媒体上发布了一条看似隐晦、实则指向明确的帖文——标题写着“PC的新时代”,并附上一组数字坐标。稍加查询便可发现,那正是中国台北表演艺术中心的位置,也是黄仁勋下周一发表主题演讲的场地。演讲定在周一上午11点(对应美国东部时间周日晚间1

英伟达微软联合官宣处理器 核显性能媲美RTX5070
科技数码 · 2026-05-30

英伟达微软联合官宣处理器 核显性能媲美RTX5070

先说结论:NVIDIA与Windows官方账号深夜联合发布消息,文案仅一句话——“A new era of PC”。配图中显示的坐标“25 0528,121 5990”是一组经纬度,指向台北音乐中心,正是2026年Computex期间黄仁勋发表主题演讲的地点。 再结合“PC新时代”这个口号,答案已然

酷态科10号电能站万象屏套装首发预约299元
科技数码 · 2026-05-30

酷态科10号电能站万象屏套装首发预约299元

酷态科10号电能站万象屏套装开启预约,首发价299元。八口AC+USB设计,最高2500W交流输出、120WUSB输出,支持小米120W澎湃秒充及多品牌兼容。配备2 8英寸万象屏,接入米家生态,支持Wi-Fi 蓝牙双模连接及OTA升级。