OpenAI开源GPT-oss模型系列:媲美GPT-4o,重磅发布
OpenAI 正式发布了两款强大的开源语言模型 —— gpt-oss-120b 与 gpt-oss-20b。这是自 GPT-2 以来,OpenAI 首次开放高性能语言模型的权重,并且采用了灵活的 Apache 2.0 开源协议,允许开发者自由使用、部署甚至定制。

无论你是独立开发者、初创企业还是学术研究机构,现在都可以免费拥有一款与 GPT-4o 能力相当的语言模型。
开源但不“阉割”:媲美 GPT-4o,运行成本极低
OpenAI 在这次发布中展现了十足的诚意:
其中,gpt-oss-120b 在核心推理任务上的表现已接近 GPT-4o-mini,支持 128k 的长上下文,单张 80GB 显存的 GPU 即可运行。而 gpt-oss-20b 的性能则对标 GPT-3.5(o3-mini),仅需 16GB 显存,非常适合部署在消费级设备、实现本地推理或离线使用等场景。
它们在以下任务中表现优异:
- Chain-of-Thought(CoT)逐步思维推理
- 工具调用(如联网搜索、代码执行)
- 医疗问答(在 HealthBench 基准测试中甚至超过 GPT-4o)
- 数学与编程任务(表现优于 o3-mini)
适用于本地部署与个性化定制
相比闭源模型,gpt-oss 的一大亮点在于:
- 模型权重完全开放(可通过 Hugging Face 下载)
- 支持推理量化(MXFP4格式),大幅降低运行门槛
- 提供 Harmony 格式工具链,支持 Python / Rust 渲染器
- 支持最新技术平台,包括 Apple Metal、PyTorch、ONNX 以及 VS Code 工具包
安全性不打折:对抗性微调也扛得住
OpenAI 在安全上的投入一如既往:
- 预训练阶段剔除了危险内容(如CBRN相关内容)
- 微调阶段采用了 deliberative alignment 对齐技术
- 评估阶段进行了“恶意微调攻击模拟”,测试模型是否容易被改造成高危系统
结论是:即使在攻击者“最大限度努力”的前提下,这些模型也未展现出高危行为能力。
此外,OpenAI 启动了 50 万美元的红队挑战赛(Red Teaming Challenge),鼓励全球开发者参与模型安全性测试,共同推动整个开源生态的安全进步。
技术细节亮点:MoE 架构 + 长上下文 + 灵活推理
gpt-oss 系列采用了先进的 Transformer 架构,并引入了以下关键技术:
技术要点包括:
- MoE(专家混合)架构:降低推理时激活参数量,提升效率
- 支持 Grouped Multi-Query Attention 与 RoPE 位置编码
- 使用全新的 o200k_harmony 分词器(今日也已一同开源)
- 推理时可设定不同的“努力等级”,在低延迟与高准确度之间灵活切换
为什么这次发布意义重大?
OpenAI 这次发布的 gpt-oss 系列,具有以下历史性意义:
- 打破壁垒:为中小型开发者、教育机构、非营利组织提供了强大工具。
- 推动安全研究:开放非监督 CoT,支持更多“可解释性”、“思维链监控”等研究方向。
- 补齐生态拼图:API 服务与本地开源模型并行发展,满足不同场景的选择需求。
- 降低 AI 不平等:开源模型的普及有助于民主化 AI 发展,尤其是在资源受限地区。
怎么用?
gpt-oss 模型现已全面开放:
- 下载地址:https://huggingface.co/openai/gpt-oss-120b
- 支持平台:Azure、AWS、vLLM、Ollama、LM Studio、Cloudflare 等
- 本地运行参考项目:PyTorch、Apple Metal、Harmony Renderer、量化模型工具等
写在最后
gpt-oss 不仅仅是一套开源大模型,更是 OpenAI 向整个 AI 开源社区发出的诚意之作。它代表了高性能、高安全性与易用性的结合,也让“每个人都能拥有自己的 GPT”成为现实。
我们正站在 AI 开源生态的重要转折点上。现在,是时候将这项技术真正掌握在自己手中了。
参考资料
- https://openai.com/index/introducing-gpt-oss/
- https://huggingface.co/openai/gpt-oss-120b
相关攻略
ChatGPT新增图像识别与语音输入填表功能,用户上传表单图片后,可通过语音或文字说明内容,AI自动识别并填写字段。该功能整合多模态能力,需同时完成图像识别、指令理解与内容生成。目前输出为静态图片,对图像质量有要求,尚未支持可编辑文档,旨在让AI更自然地执行连贯任务,简化人工操作。
OpenAI为ChatGPT新增AI填表功能,用户上传表格图片后,可通过语音或文字指令让系统自动识别表单结构并填写内容,甚至可基于表格生成图片。目前输出为静态图片,对图像质量有要求,但将繁琐流程转化为自然对话,展现了多模态AI助手的实用潜力。
OpenAI在2026年第一季度营收达57亿美元,较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品,付费用户持续增长,但业务重心正转向企业服务。尽管营收亮眼,公司调整后营业利润率仍为负值,面临显著亏损。为应对竞争与盈利压力,OpenAI正加速推进上市进程,最早或于今年9月进行IPO。
微软发布专为浏览器设计的Fara1 5系列AI智能体模型,包含4B、9B和27B三个版本。该模型基于Qwen3 5构建,通过观察浏览器截图输出操作指令,采用“观察—思考—行动”循环决策。在Online-Mind2Web基准测试中,Fara1 5-27B任务成功率达72%,超越多款主流模型。其训练使用了约200万条混合数据,并设计了在信息缺失、任务模糊或执行不
OpenAI一款未发布的通用推理模型独立推翻了悬置近80年的埃尔德什“平面单位距离猜想”。模型未经专门训练,运用代数数论构造反例完成证明。此前OpenAI曾因虚假突破受批评,但此次成果获包括原批评者在内的多位顶级数学家背书,被视为AI自主产出重要数学发现的标志性进展。
热门专题
热门推荐
在追求极致效率的现代软件开发中,一款名为Cursor的AI代码编辑器正引领着开发范式的变革。它被定义为“面向未来的IDE”,其核心理念清晰而有力:将人工智能深度无缝地集成到编码工作流的每一个步骤,为开发者创造一种前所未有的“AI结对编程”体验。 Cursor sh应用场景 那么,这款AI驱动的编辑器
在众多AI图像生成工具中,WHEE凭借其精准的产品定位与持续的功能迭代,正成为越来越多设计师和内容创作者的首选工具。它专注于打造高品质的AI视觉素材生成器,核心使命就是帮助用户快速、高效地获得可直接使用的优质图片素材。 那么,这款AI绘图工具究竟有哪些核心优势?下面我们从其关键特性与功能设计进行深入
在AI绘画工具不断涌现的当下,一款名为NightCafe Creator的应用以其全面的AI艺术生成能力脱颖而出。它不仅是一个简单的图片处理工具,更是一个融合了多种前沿人工智能技术的创意平台,帮助用户轻松实现从构思到成品的艺术创作。 NightCafe Creator是什么? NightCafe C
近期加密货币市场受到宏观经济不确定性及流动性紧缩影响,比特币(BTC)、以太坊(ETH)以及多种山寨币出现明显下行走势,市场情绪趋于谨慎。 比特币近期走势分析 比特币的价格近期表现如何?简单来说,它跌破了几个市场公认的关键支撑位,而且伴随交易量的放大。这种放量下跌的信号,往往意味着多空分歧加剧。无论
蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。





