首页 游戏 软件 资讯 排行榜 专题
首页
AI
o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰

o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰

热心网友
29
转载
2026-04-29

o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰

消息来了,“12 Days of OpenAI”活动正式落下帷幕。压轴亮相的,是OpenAI全新的o3系列大模型。官方这次给的说法相当有分量:在某些场景下,其推理能力已经非常接近通用人工智能(AGI)的门槛了。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰

名称:为何是o3?

你可能注意到了,这次发布直接从o1跳到了o3,中间的o2去哪了?在今天早上的直播活动里,OpenAI首席执行官山姆・阿尔特曼揭晓了答案:主要是为了避免与英国电信运营商O2的商标产生冲突。看吧,即便是前沿科技巨头,也得遵守商业世界的基本规则。

邀请安全测试:谨慎的开放步伐

作为o1推理模型的正式继任者,o3系列包含完整版和一个精简版本——o3-mini。后者主要针对特定任务进行了优化和微调。

不过,OpenAI没有选择立即全面开放。他们的策略相当谨慎:即日起,先邀请安全研究人员注册测试预览版的o3-mini模型,后续再逐步推出完整版o3的预览。对于普通开发者和研究者来说,现在可以前往官网提交申请,排队等候。阿尔特曼没有给出o3模型的具体开放时间表,只透露o3-mini预计在2025年1月底推出,完整的o3模型则要再等等。

o3模型推理:核心差异在哪里?

o3模型与市面上主流AI模型的一个根本性不同,在于它内置了事实核查机制。这个设计能帮助模型规避一些常见的“幻觉”或逻辑陷阱,但代价也很明显:响应会产生延迟。根据问题推理的复杂程度,这个延迟可能在几秒到几分钟不等。

另一个亮点是o3系列使用了所谓的“私人思想链”进行“思考”。简单来说,模型在最终给出答案前,会先“暂停”一下,在内部详细地推演整个思考过程,然后才总结出最准确的结论。此外,o3还引入了一个新功能:允许用户调整推理时间,分为低、中、高三种计算级别。级别越高,模型执行任务的性能就越好,当然,成本也越高。

性能与AGI:关键的里程碑

这里需要先明确一下AGI的概念。AGI,即通用人工智能,通常指能够像人类一样执行各类任务的AI系统。OpenAI自己给出的定义更务实一些:是“在最具经济价值的工作中超越人类的高度自治系统”。

OpenAI朝着这个目标迈进,除了技术野心,其实在商业层面也有特别的含义。根据其与重要合作伙伴微软的协议条款,一旦OpenAI达成自己定义的AGI,就不再负有向微软提供其最先进技术的义务。因此,每一次模型能力的重大突破,都不仅仅是技术新闻。

而o3,无疑是迈向该目标的关键一步。在衡量AGI潜力的ARC-AGI基准测试中,o3在高计算设置下拿到了87.5%的分数,低计算设置下也有75.7%,整体性能达到了o1的三倍。当然,ARC-AGI的联合创始人弗朗索瓦·乔莱也坦言,高计算设置的成本非常高昂,每个任务可能要花费数千美元。

在其他多项专业基准测试中,o3的表现同样亮眼:

  • 在SWE-Bench Verified编程任务测试中,成绩比o1高出22.8个百分点
  • 在Codeforces编程技能测试中,获得了2727的评分
  • 在2024年美国数学邀请赛中,得分高达96.7%;
  • 在GPQA Diamond研究生水平的生物、物理和化学测试中,得分87.7%
  • 最惊人的是在EpochAI的Frontier Math基准测试中,o3解决了25.2%的难题(其他所有模型均未超过2%),创造了新纪录。

需要指出的是,以上结果均来自OpenAI的内部评估。模型实力的最终定论,还需要等待更广泛的外部客户和独立机构的测试来验证。

安全:不可忽视的另一面

毫无疑问,o3的发布标志着OpenAI在通用人工智能的漫长征程上,迈出了坚实而重要的一步。其展现出的推理能力令人印象深刻,但随之而来的潜在风险也必须得到同等重视。强大的推理能力若被滥用,后果可能更严重。对此,OpenAI方面承诺将持续投入模型安全研究,并积极与其他机构合作,共同构建更完善、更可靠的评估与基准测试体系。这条路,注定是能力与责任并重的双线赛跑。

来源:https://www.1ai.net/25411.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

吉利汽车一季度营收首破800亿元,核心归母净利润同比增长31%
业界动态
吉利汽车一季度营收首破800亿元,核心归母净利润同比增长31%

吉利汽车2026财年首季:营收首破800亿,自主品牌销量登顶 4月29日,吉利汽车交出了一份颇具分量的季度成绩单。2026财年第一季度报告显示,公司营业总收入达到838亿元,同比增长15%;核心归母净利润为45 6亿元,同比增幅高达31%。开门红的态势,相当明显。 销量的强劲增长是业绩的基石。整个第

热心网友
04.29
Kyber Network攻击者已将2900枚ETH转入Tornado Cash
web3.0
Kyber Network攻击者已将2900枚ETH转入Tornado Cash

Kyber Network攻击者再度转移资金,近3000枚ETH流入混币器 区块链安全领域又有了新动态。根据PeckShield监测机构发布的数据,就在4月29日,此前攻击Kyber Network的黑客有了新动作——他们将总计2,900枚ETH,按当时市价计算约合680万美元,分批转入了知名的隐私

热心网友
04.29
第四周比赛结束后 无畏契约 EMEA赛区第一阶段季后赛形势逐渐明朗
游戏攻略
第四周比赛结束后 无畏契约 EMEA赛区第一阶段季后赛形势逐渐明朗

VCT EMEA 第一赛段第四周战报:季后赛版图初定,最终轮悬念丛生 随着第四周比赛的尘埃落定,VCT EMEA 第一赛段的小组赛也进入了最后的冲刺阶段。季后赛的晋级形势,在几场关键对决后,已经勾勒出大致的轮廓,但最终的门票归属,仍留有几处引人遐想的悬念。 先来看看过去一周的战果: Eternal

热心网友
04.29
《爱琳诗篇》新SP「希格」!双重形态、强力收割
游戏攻略
《爱琳诗篇》新SP「希格」!双重形态、强力收割

各位团长好! 今天,咱们要迎来一位既熟悉又陌生的“新朋友”。 一位沉睡千年而苏醒的半神裔战士,一位将光明与黑暗之力集于一身的混沌黑骑士! 没错,这位即将登场的时空系刺客,正是: 新SP - 黑骑士希格 基础信息 ◆英雄名:混沌之光-黑骑士希格 ◆阵营:时空系 ◆特长:变身、收割 ◆职业:刺客 ◆上线

热心网友
04.29
宝可梦Pokopia水边小船栖息处怎么解锁
游戏攻略
宝可梦Pokopia水边小船栖息处怎么解锁

宝可梦pokopia:解锁水边小船栖息处全攻略 在宝可梦pokopia的世界里,水边小船栖息处绝对是一个值得探索的秘密角落。想要揭开它的神秘面纱?别急,需要满足几个特定的条件才能顺利解锁。 主线剧情是钥匙 首先,你得在游戏主线剧情上达到一定的进度。这通常意味着,你需要完成一系列关键任务,推动整个故事

热心网友
04.29