首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
苹果自研AI模型Manzano亮相,多模态能力媲美GPT-4o

苹果自研AI模型Manzano亮相,多模态能力媲美GPT-4o

热心网友
35
转载
2025-09-29

据最新消息,苹果公司正秘密研发代号为"Manzano"的新型图像AI模型。这一创新技术将突破性地实现图像识别与生成的双重能力,标志着苹果在人工智能领域的重要布局。

目前该项目仍处于研发阶段,仅有一份主要由华人学者参与的预研论文披露(包括已转投Meta的研究员庞若鸣)。论文中展示了部分概念验证图像,分辨率虽低但能处理复杂指令场景。

苹果探索自研多模态

苹果技术团队坦言,这种双重能力的融合一直是业内技术瓶颈,导致多数开源模型在整体性能上逊色于OpenAI和Google的商业化产品。

内部测试数据显示,Manzano的表现已与GPT-4o、Gemini 2.5等业界标杆旗鼓相当,甚至在某些场景下超越DeepSeek Janus Pro等专业模型。

苹果探索自研多模态

研究人员发现,现有AI模型普遍存在"偏科"现象:专精分析的模型生成能力弱,擅长创作的模型理解能力差。特别在处理含大量文字的图像(如文档、图表)时表现欠佳。其症结在于传统架构难以同时优化连续型理解和离散型生成两种处理模式。

Manzano创新性地采用混合分词方案:共享编码器可同步输出用于理解的浮点标记和用于生成的分类标记。这种同源异构设计大幅降低了任务冲突概率。

苹果探索自研多模态

系统采用三层架构:混合分词器+统一语言模型+独立图像解码器。解码器研发了9亿/17.5亿/35.2亿参数三个版本,最高支持4K级图像处理。

训练过程分为三阶段,累计消耗23亿图文数据集和10亿文图数据集,处理标记量达1.6万亿。部分训练素材来自DALL-E3和ShareGPT-4o生成的合成数据。

性能测试显示,300亿参数版本在ScienceQA等专业评测中表现亮眼,图表解析能力尤为突出。模型呈现明显的规模效应,大版本在部分任务中领先小版本超过10个百分点。

苹果探索自研多模态

在垂直领域对比测试中,Manzano与专用系统的差距控制在5%以内。图像生成方面同样表现出色,可完成风格转换、景深模拟等高阶创意任务。

虽然Manzano展示了模块化设计的优势,为多模态AI发展提供了新思路,但苹果整体AI实力仍与头部企业存在差距。即使推出新框架,iOS 26仍计划集成GPT-5。这套自主技术能否真正改变苹果的AI战略,还需时间检验。

来源:https://www.ithome.com/0/886/285.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

苹果 iPhone 17 Pro 将首次全程直播 MLS 赛事提供多视角画面
科技数码
苹果 iPhone 17 Pro 将首次全程直播 MLS 赛事提供多视角画面

北京时间5月24日,一场美国职业足球大联盟比赛将全程由iPhone17Pro拍摄转播,不再使用传统专业摄像机。此举标志着iPhone首次独立完成大型职业赛事拍摄。手机的小巧灵活使其能置于球门后等特殊位置,提供更多独特视角与临场画面。这是苹果在体育转播领域从辅助到主导的关键尝试。

热心网友
05.23
谷歌就反垄断裁决提起上诉 称搜索成功源于创新而非排他协议
业界动态
谷歌就反垄断裁决提起上诉 称搜索成功源于创新而非排他协议

谷歌就反垄断裁决提起上诉,坚称其搜索市场主导地位源于产品创新、持续投入与努力,而非排他协议。谷歌认为苹果选择其作为默认搜索引擎是自主商业决策,且未损害竞争,要求法院撤销此前要求其开放数据等整改措施。

热心网友
05.23
苹果A3577认证曝光 预计为Beats新款蓝牙头戴耳机
科技数码
苹果A3577认证曝光 预计为Beats新款蓝牙头戴耳机

一款型号为A3577的苹果蓝牙头戴式耳机在FCC认证文件中曝光,具体规格与设计尚未披露。外界猜测其可能属于Beats系列,例如即将更新的StudioPro迭代产品,主要依据是该系列产品已近三年更新周期,市场期待其在音质与降噪等方面有所提升。

热心网友
05.23
币安Binance安卓苹果手机App下载注册与交易入门教程
web3.0
币安Binance安卓苹果手机App下载注册与交易入门教程

重要提示:在下载过程中,您的浏览器可能会弹出关于文件安全的常规提醒。这属于正常现象,建议您选择“仍然下载”或类似选项以继续完成下载过程。 币安Binance便捷交易入口: 币安Binance安卓APP下载链接: 币安Binance苹果登录入口: 一、下载与安装指南 第一步,直接点击官方授权下载通道即

热心网友
05.22
苹果在印度发布睡眠呼吸暂停检测与听力健康测试新功能
科技数码
苹果在印度发布睡眠呼吸暂停检测与听力健康测试新功能

苹果在印度推出两项健康监测新功能。睡眠呼吸暂停监测利用AppleWatch加速度计检测异常呼吸引发的手腕运动,发现风险后发出提醒。听力测试功能则通过AirPodsPro播放不同频率纯音,评估用户听力水平并生成详细听力图。两项功能均利用现有硬件提供健康洞察,数据存储于本地健康应用以保护隐私。

热心网友
05.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

菩提苦海万事知任务全流程攻略
游戏攻略
菩提苦海万事知任务全流程攻略

在《燕云十六声》中领悟“菩提苦海”,需沉浸探索游戏世界。主线剧情构建认知框架,战斗观察、场景细节与NPC对话皆暗藏线索。通过多元视角拼凑因果,方能深入理解游戏蕴含的宏大叙事与深邃魅力。

热心网友
05.23
海信618电视销量夺冠 Mini LED技术加速普及
业界动态
海信618电视销量夺冠 Mini LED技术加速普及

2026年618大促的序幕刚刚拉开,初期战报已经透露出一些耐人寻味的信号。截至5月21日,海信电视在京东平板电视累计销售竞速榜上拔得头筹,其RGB-Mini LED爆款王——海信小墨E5S Pro,更是同时拿下了天猫平板电视和抖音大家电的5 20单品销冠。 这并非偶然。奥维云网的全渠道监测数据给出了

热心网友
05.23
极氪800kW液冷超充桩上线 峰值电流800A充电更快
业界动态
极氪800kW液冷超充桩上线 峰值电流800A充电更快

充电桩领域的“军备竞赛”再次迎来重磅升级。5月22日,极氪汽车正式发布了其全新一代液冷超级充电桩,将单枪峰值功率一举提升至行业领先的800kW,标志着超充技术迈入新阶段。 根据官方披露的核心信息,这款超充桩主要具备四大优势:极速补能、高效节能、广泛适配与多重安全。具体而言,其单枪峰值电流高达800A

热心网友
05.23
红色沙漠电弧机剑获取攻略与详细步骤解析
游戏攻略
红色沙漠电弧机剑获取攻略与详细步骤解析

获取电弧机剑主要有五种途径:推进主线任务以解锁线索;探索遗迹、工厂等特定区域;挑战特定副本与Boss;完成提及传说武器或遗物的支线任务;参与限时活动并达成要求。玩家可根据偏好选择或组合多种方式获取该武器。

热心网友
05.23
小米汽车试驾活动重启 预约即送1比64合金车模
业界动态
小米汽车试驾活动重启 预约即送1比64合金车模

小米汽车再次为潜在车主带来惊喜福利!即日起至5月31日,用户只需提前完成预约,并到店参与任意车型的试驾体验,即可免费获赠一款1:64精致合金车模。车模款式与颜色随机发放,为试驾过程增添一份专属的收藏乐趣,诚意十足。 参与本次活动需注意以下细则:试驾必须通过官方渠道提前预约;各授权门店的车模备货数量不

热心网友
05.23