o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰
o3 压台登场:OpenAI 卷动推理 AI模型风云,迈向 AGI 新巅峰
消息来了,“12 Days of OpenAI”活动正式落下帷幕。压轴亮相的,是OpenAI全新的o3系列大模型。官方这次给的说法相当有分量:在某些场景下,其推理能力已经非常接近通用人工智能(AGI)的门槛了。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

名称:为何是o3?
你可能注意到了,这次发布直接从o1跳到了o3,中间的o2去哪了?在今天早上的直播活动里,OpenAI首席执行官山姆・阿尔特曼揭晓了答案:主要是为了避免与英国电信运营商O2的商标产生冲突。看吧,即便是前沿科技巨头,也得遵守商业世界的基本规则。
邀请安全测试:谨慎的开放步伐
作为o1推理模型的正式继任者,o3系列包含完整版和一个精简版本——o3-mini。后者主要针对特定任务进行了优化和微调。
不过,OpenAI没有选择立即全面开放。他们的策略相当谨慎:即日起,先邀请安全研究人员注册测试预览版的o3-mini模型,后续再逐步推出完整版o3的预览。对于普通开发者和研究者来说,现在可以前往官网提交申请,排队等候。阿尔特曼没有给出o3模型的具体开放时间表,只透露o3-mini预计在2025年1月底推出,完整的o3模型则要再等等。
o3模型推理:核心差异在哪里?
o3模型与市面上主流AI模型的一个根本性不同,在于它内置了事实核查机制。这个设计能帮助模型规避一些常见的“幻觉”或逻辑陷阱,但代价也很明显:响应会产生延迟。根据问题推理的复杂程度,这个延迟可能在几秒到几分钟不等。
另一个亮点是o3系列使用了所谓的“私人思想链”进行“思考”。简单来说,模型在最终给出答案前,会先“暂停”一下,在内部详细地推演整个思考过程,然后才总结出最准确的结论。此外,o3还引入了一个新功能:允许用户调整推理时间,分为低、中、高三种计算级别。级别越高,模型执行任务的性能就越好,当然,成本也越高。
性能与AGI:关键的里程碑
这里需要先明确一下AGI的概念。AGI,即通用人工智能,通常指能够像人类一样执行各类任务的AI系统。OpenAI自己给出的定义更务实一些:是“在最具经济价值的工作中超越人类的高度自治系统”。
OpenAI朝着这个目标迈进,除了技术野心,其实在商业层面也有特别的含义。根据其与重要合作伙伴微软的协议条款,一旦OpenAI达成自己定义的AGI,就不再负有向微软提供其最先进技术的义务。因此,每一次模型能力的重大突破,都不仅仅是技术新闻。
而o3,无疑是迈向该目标的关键一步。在衡量AGI潜力的ARC-AGI基准测试中,o3在高计算设置下拿到了87.5%的分数,低计算设置下也有75.7%,整体性能达到了o1的三倍。当然,ARC-AGI的联合创始人弗朗索瓦·乔莱也坦言,高计算设置的成本非常高昂,每个任务可能要花费数千美元。
在其他多项专业基准测试中,o3的表现同样亮眼:
- 在SWE-Bench Verified编程任务测试中,成绩比o1高出22.8个百分点;
- 在Codeforces编程技能测试中,获得了2727的评分;
- 在2024年美国数学邀请赛中,得分高达96.7%;
- 在GPQA Diamond研究生水平的生物、物理和化学测试中,得分87.7%;
- 最惊人的是在EpochAI的Frontier Math基准测试中,o3解决了25.2%的难题(其他所有模型均未超过2%),创造了新纪录。
需要指出的是,以上结果均来自OpenAI的内部评估。模型实力的最终定论,还需要等待更广泛的外部客户和独立机构的测试来验证。
安全:不可忽视的另一面
毫无疑问,o3的发布标志着OpenAI在通用人工智能的漫长征程上,迈出了坚实而重要的一步。其展现出的推理能力令人印象深刻,但随之而来的潜在风险也必须得到同等重视。强大的推理能力若被滥用,后果可能更严重。对此,OpenAI方面承诺将持续投入模型安全研究,并积极与其他机构合作,共同构建更完善、更可靠的评估与基准测试体系。这条路,注定是能力与责任并重的双线赛跑。
热门专题
热门推荐
吉利汽车2026财年首季:营收首破800亿,自主品牌销量登顶 4月29日,吉利汽车交出了一份颇具分量的季度成绩单。2026财年第一季度报告显示,公司营业总收入达到838亿元,同比增长15%;核心归母净利润为45 6亿元,同比增幅高达31%。开门红的态势,相当明显。 销量的强劲增长是业绩的基石。整个第
Kyber Network攻击者再度转移资金,近3000枚ETH流入混币器 区块链安全领域又有了新动态。根据PeckShield监测机构发布的数据,就在4月29日,此前攻击Kyber Network的黑客有了新动作——他们将总计2,900枚ETH,按当时市价计算约合680万美元,分批转入了知名的隐私
VCT EMEA 第一赛段第四周战报:季后赛版图初定,最终轮悬念丛生 随着第四周比赛的尘埃落定,VCT EMEA 第一赛段的小组赛也进入了最后的冲刺阶段。季后赛的晋级形势,在几场关键对决后,已经勾勒出大致的轮廓,但最终的门票归属,仍留有几处引人遐想的悬念。 先来看看过去一周的战果: Eternal
各位团长好! 今天,咱们要迎来一位既熟悉又陌生的“新朋友”。 一位沉睡千年而苏醒的半神裔战士,一位将光明与黑暗之力集于一身的混沌黑骑士! 没错,这位即将登场的时空系刺客,正是: 新SP - 黑骑士希格 基础信息 ◆英雄名:混沌之光-黑骑士希格 ◆阵营:时空系 ◆特长:变身、收割 ◆职业:刺客 ◆上线
宝可梦pokopia:解锁水边小船栖息处全攻略 在宝可梦pokopia的世界里,水边小船栖息处绝对是一个值得探索的秘密角落。想要揭开它的神秘面纱?别急,需要满足几个特定的条件才能顺利解锁。 主线剧情是钥匙 首先,你得在游戏主线剧情上达到一定的进度。这通常意味着,你需要完成一系列关键任务,推动整个故事





