OpenAI正式推出首个免费推理模型o3-mini 竞争压力来自DeepSeek
清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然刺耳蜂鸣——屏幕上跳出的消息写着“o3-mini来了”。这一瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡。今天,OpenAI 发布了 o3-mini 和 o3-mini-high 两个版本,而且首次向免费用户开放推理模型,这在行业里是个标志性事件。
清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然刺耳蜂鸣——屏幕上跳出的消息写着“o3-mini来了”。这一瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡。今天,OpenAI 发布了 o3-mini 和 o3-mini-high 两个版本,而且首次向免费用户开放推理模型,这在行业里是个标志性事件。看来,DeepSeek那场“卷风”确实刮到了硅谷。
## o3-mini 系列:小型推理模型的全新进化
o3-mini 是 OpenAI 推理模型系列的最新力作。官方将其定位为“轻量级”代表,但它绝不是简单的缩小版——在高效推理能力和运算处理之间找到了极佳的平衡点,尤其在 STEM(科学、技术、工程、数学)任务中表现抢眼。这次发布,本质上是对传统推理模型边界的一次重新定义。
更值得关注的是,这是 OpenAI 首次向免费用户提供推理模型,同时支持实时搜索功能,回答能附上网页链接,信息更丰富、更及时。虽然目前还处于原型阶段,但团队正在将搜索深度整合到推理中,未来反馈会更加精准。
免费用户只需在 ChatGPT 中选择“搜索+推理”即可体验。
## 实战体验:从“降智”疑虑到真实表现
第一次上手测试,画风有点诡异——输出速度飞快,没有思考过程,结果还不太对劲。难道这模型“降智”了?换成电脑重新测试后,终于看到正常的 o3-mini-high:思考过程全英文,层层推理,最终输出中文结果干净利落。前后反差让人联想到所谓的“降智”问题——可能是移动端触发了简化模式,也可能是网络延迟。这个话题值得另开一篇专门讨论。
另一个经典测试:“今天买了三个苹果,我昨天吃了一个,我还有几个呢?”很多模型在这个问题上翻车,而 o3-mini 毫无悬念地答对了。随后网友的测试更让人眼前一亮:有人让它“写一个在超立方体内弹跳的小球的 Python 脚本”,结果生成的模拟效果惊艳,物理规则把握得相当到位。
再来看一个对比测试:要求生成“在旋转六边形内受重力和摩擦力影响、真实弹跳的小球”的 Python 程序。o3-mini 的效果更贴近实际需求,而 DeepSeek-R1 在视觉真实度上稍逊一筹。从整体编程能力和物理模拟来看,o3-mini high 确实属于第一梯队。
## 定价情况
OpenAI 对 o3-mini 的定价分层清晰:ChatGPT 免费用户有有限访问权限(选择“推理”模式),Plus/Team 用户每日 150 条消息,Pro 用户每月 200 美元无限制。API 方面,o3-mini 的输入/输出价格远高于 DeepSeek-R1(后者仅为 0.14 美元和 0.55 美元)。两个月前强大的推理模型还只能付费使用,如今无论 DeepSeek-R1 还是 ChatGPT 的 o3-mini,都能免费体验——这对用户和开发者来说,门槛实实在在地降低了。
当然,o3-mini high 和 o1-pro 这类顶尖模型仍然需要付费,但整体趋势已经非常明显:免费+推理将成为新常态。
在发布后的 Reddit 问答活动中,Sam Altman 透露出一些策略变化:“我们将比往年保持的领先优势更小”“重新思考开源策略”。这两点无疑表明,在 DeepSeek 带来的冲击下,OpenAI 正在积极调整方向,适应新一轮技术变革。
## 说到最后,重点在这
从清晨惊醒开始,到深入体验 o3-mini 与 o3-mini-high 的表现,可以清晰地看到这次发布为 AI 推理领域带来的碘伏性改变。免费、高效、实时搜索——这三个关键词合成起来,意味着推理模型不再是少数人的特权,而是走向大众的起点。竞争还在继续,但用户永远是最大的赢家。
来源:https://www.53ai.com/news/finetuning/2025020215706.html
相关热点
继续查看同栏目近期热点。
延伸阅读
补充最近整理过的热点入口。
