OpenAI开源GPT-oss模型系列：媲美GPT-4o，重磅发布

时间：2025-12-16 19:52

OpenAI 正式发布了两款强大的开源语言模型 —— gpt-oss-120b 与 gpt-oss-20b。这是自 GPT-2 以来，OpenAI 首次开放高性能语言模型的权重，并且采用了灵活的 A

OpenAI 正式发布了两款强大的开源语言模型 —— gpt-oss-120b 与 gpt-oss-20b。这是自 GPT-2 以来，OpenAI 首次开放高性能语言模型的权重，并且采用了灵活的 Apache 2.0 开源协议，允许开发者自由使用、部署甚至定制。

无论你是独立开发者、初创企业还是学术研究机构，现在都可以免费拥有一款与 GPT-4o 能力相当的语言模型。

开源但不“阉割”：媲美 GPT-4o，运行成本极低

OpenAI 在这次发布中展现了十足的诚意：

其中，gpt-oss-120b 在核心推理任务上的表现已接近 GPT-4o-mini，支持 128k 的长上下文，单张 80GB 显存的 GPU 即可运行。而 gpt-oss-20b 的性能则对标 GPT-3.5（o3-mini），仅需 16GB 显存，非常适合部署在消费级设备、实现本地推理或离线使用等场景。

它们在以下任务中表现优异：

Chain-of-Thought（CoT）逐步思维推理
工具调用（如联网搜索、代码执行）
医疗问答（在 HealthBench 基准测试中甚至超过 GPT-4o）
数学与编程任务（表现优于 o3-mini）

适用于本地部署与个性化定制

相比闭源模型，gpt-oss 的一大亮点在于：

模型权重完全开放（可通过 Hugging Face 下载）
支持推理量化（MXFP4格式），大幅降低运行门槛
提供 Harmony 格式工具链，支持 Python / Rust 渲染器
支持最新技术平台，包括 Apple Metal、PyTorch、ONNX 以及 VS Code 工具包

安全性不打折：对抗性微调也扛得住

OpenAI 在安全上的投入一如既往：

预训练阶段剔除了危险内容（如CBRN相关内容）
微调阶段采用了 deliberative alignment 对齐技术
评估阶段进行了“恶意微调攻击模拟”，测试模型是否容易被改造成高危系统

结论是：即使在攻击者“最大限度努力”的前提下，这些模型也未展现出高危行为能力。

此外，OpenAI 启动了 50 万美元的红队挑战赛（Red Teaming Challenge），鼓励全球开发者参与模型安全性测试，共同推动整个开源生态的安全进步。

技术细节亮点：MoE 架构 + 长上下文 + 灵活推理

gpt-oss 系列采用了先进的 Transformer 架构，并引入了以下关键技术：

技术要点包括：

MoE（专家混合）架构：降低推理时激活参数量，提升效率
支持 Grouped Multi-Query Attention 与 RoPE 位置编码
使用全新的 o200k_harmony 分词器（今日也已一同开源）
推理时可设定不同的“努力等级”，在低延迟与高准确度之间灵活切换

为什么这次发布意义重大？

OpenAI 这次发布的 gpt-oss 系列，具有以下历史性意义：

打破壁垒：为中小型开发者、教育机构、非营利组织提供了强大工具。
推动安全研究：开放非监督 CoT，支持更多“可解释性”、“思维链监控”等研究方向。
补齐生态拼图：API 服务与本地开源模型并行发展，满足不同场景的选择需求。
降低 AI 不平等：开源模型的普及有助于民主化 AI 发展，尤其是在资源受限地区。

怎么用？

gpt-oss 模型现已全面开放：

下载地址：https://huggingface.co/openai/gpt-oss-120b
支持平台：Azure、AWS、vLLM、Ollama、LM Studio、Cloudflare 等
本地运行参考项目：PyTorch、Apple Metal、Harmony Renderer、量化模型工具等

写在最后

gpt-oss 不仅仅是一套开源大模型，更是 OpenAI 向整个 AI 开源社区发出的诚意之作。它代表了高性能、高安全性与易用性的结合，也让“每个人都能拥有自己的 GPT”成为现实。

我们正站在 AI 开源生态的重要转折点上。现在，是时候将这项技术真正掌握在自己手中了。

参考资料

https://openai.com/index/introducing-gpt-oss/
https://huggingface.co/openai/gpt-oss-120b

来源：https://www.51cto.com/article/822443.html

OpenAI 大模型开源 AI 人工智能

上一篇智能制造核心支柱：SCADA、物联网与MES系统解析 下一篇InnoDB自增锁解析：MySQL表锁真相与优化策略

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时，同比增长5 0%。充换电服务业用电增速高达48 8%，信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市联体风扇售价429元

追风者冰川360S25液冷散热器售价429元，三联一体风扇便捷安装，冷头小体积纯铜底座噪音18dB，风扇转速300-2000RPM、风量75CFM、静压2 96mmAq，五年质保漏液包赔。

科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映，GooglePlayServices后台耗电异常，电量占比最高达99 97%，远超正常水平，严重影响续航。目前故障原因不明，谷歌尚未发布官方声明。

科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足盼新CEO改进

罗永浩批评苹果iOS27创新不足，称仅有双iPhone同号、音量分离等数十项细节改进，认为库克时代缺乏突破性创新，股市虽好但消费者只能被迫接受挤牙膏式升级。

科技数码 · 2026-06-29

年国产车出口710万辆，两家车企销量破百万

2025年国产汽车出口总量达710万辆，同比增长21%。奇瑞以134万辆居首，比亚迪105万辆次之，上汽乘用车出口占比60%最高，长城出口51万辆。吉利、长安等主流品牌同步增长，小鹏、零跑等新兴品牌海外拓展加速。