游乐游手机版
首页/科技数码/文章详情

阿里通义千问Qwen3-Max问世,数学推理满分的AI模型超越GPT5

时间:2025-09-24 13:51
9月24日消息,今日,2025云栖大会开幕,阿里通义旗舰模型Qwen3-Max重磅亮相,性能超过GPT5、Claude Opus 4等,跻身全球前三。据悉,Qwen3-Max包括指令(Instruc

阿里发布重磅AI模型Qwen3-Max 剑指行业前三

9月24日,2025云栖大会正式开幕。会上阿里正式发布了通义千问旗舰级大模型Qwen3-Max,其综合性能表现超越GPT5和Claude Opus 4等国际竞品,成功挺进全球AI大模型第一阵营。

双版本并行 全球排名亮眼

Qwen3-Max创新性地推出"指令(Instruct)"和"推理(Thinking)"两个专项版本。目前预览版已在国际权威AI评测平台Chatbot Arena位列第三,预计正式版将带来更多性能突破。

万亿级参数的王者实力

作为通义千问系列目前最强的基座模型,Qwen3-Max展现了令人瞩目的技术实力:

  • 训练数据达36万亿token量级
  • 总参数量突破万亿大关
  • 编程能力和智能体工具调用能力突出

在国际编程能力测试SWE-Bench Verified中,Qwen3-Max Instruct版以69.6的高分进入全球第一梯队;而在智能体工具调用测试Tau2-Bench中更是创下74.8分的记录,领先Claude Opus4和DeepSeek-V3.1等强劲对手。

Qwen3-Max性能数据图表

推理能力获重大突破

Qwen3-Max的强化版Qwen3-Max-Thinking-Heavy在并行推理技术的加持下表现惊艳:

  • 数学推理测试AIME 25和中国高中数学联赛(HMMT)双满分
  • 开创业内首个100分纪录
  • 首创代码求解+工具调用的解题模式

该模型的卓越表现源于两项关键技术突破:首先是在解题过程中灵活调用计算工具的能力,其次是充分利用了计算资源的扩展优势。

Qwen3-Max推理能力展示

全栈产品矩阵正式成型

通义千问系列已完成从5亿到超万亿参数的全尺寸布局,包含300余款细分模型,覆盖各类应用场景。即日起用户可通过以下途径体验:

  • QwenChat免费试用Qwen3-Max
  • 阿里云百炼平台调用API服务
来源:https://m.mydrivers.com/newsview/1076553.html
上一篇一加2025游戏大会:超高帧率技术引领行业革新 下一篇雷军2025健身计划接近尾声:99次打卡达成目标100次
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo