游乐游手机版
首页/科技数码/文章详情

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

时间:2025-09-07 10:10
总参数达到1万亿,阿里迄今为止最大的模型来了!没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。1万亿啥概念?几乎一下子就比前一代Qwen3(235B)多了四倍

总参数达到1万亿,阿里迄今为止最大的模型来了!

没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。

1万亿啥概念?几乎一下子就比前一代Qwen3(235B)多了四倍之多,相当于给大学生换了个爱因斯坦的脑子(bushi~

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

根据最新介绍,其最大亮点如下:

相较于2.5系列,新版本在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

而且发布即全面上线,目前可通过通义APP、 Qwen Chat网页和阿里云API体验。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

更多最新测评显示,Qwen3-Max-Preview一登场不仅比自家前一代最强模型Qwen3(235B)更强,而且还打败了包括Claude Opus 4在内的国内外劲敌。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

国内外反响更是一片热烈,随之而来的还有一大波测评:

1万亿!模型规模真是越来越扩张了,迫不及待想要尝试。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

Qwen再次令人惊叹!

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

so,模型真实效果如何?不妨简单实测一下见真章。

支持多模态,编程已无需抽卡

综合最新测评和网友反馈,接下来我们主要考查Qwen3-Max-Preview解答难题和动手编程的能力。

需要提醒一下,阿里从Qwen3(235B)开始就不再使用混合思维模式,所以这次的Instruct版本仅支持非思考模式。

使用Qwen Chat网页,一上来就给它扔一道AIME数学竞赛题试试:

(AIME:美国数学邀请赛,是介于AMC10、AMC12及美国数学奥林匹克竞赛之间的一个数学竞赛。)

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

由于Qwen3-Max-Preview支持多模态,这里我们可以直接上传图片。

几乎转眼间,模型就唰唰唰地给出了详细作答过程及结果,最终答案“204”也与AIME这道题的标准答案一致。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

小试牛刀过后,接下来进入编程环节。

用p5js创建多彩的可交互动画。

速度同样很快,Qwen3-Max-Preview几乎立即给出了一段完整代码,而且代码能够成功运行。

鼠标点到哪里,哪里就会产生交互效果:

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

生成一个扫雷游戏。

一句话制作扫雷这种经典小游戏也是轻轻松松,而且是一次成功,无需反复沟通和抽卡。

代码成功运行后,我们也简单试玩了一下,只是很快就“踩雷”了(doge):

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

最后来试试制作前端网页,不妨就让它来个自我介绍:

帮我制作一个介绍Qwen3-Max-Preview的可交互 。

代码生成后,既可以保存成文件直接打开,还能在问答末尾点击“预览”一键查看效果。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

预览效果如下, 设计简洁直观,也具有初级交互效果:

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

当然,如果你更懂提示词,效果也会更好,某网友为Qwen3-Max-Preview制作的庆祝网页效果就还不错。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

顺带一提,还有人对Qwen3-Max-Preview的生成速度进行了实际评估,大家可以感受一下:

以>107个token/秒的速度生成4467个token。

拜拜Claude!阿里最强万亿模型编程秒了Opus4 实测在此

来源:https://news.mydrivers.com/1/1072/1072879.htm
上一篇全新问界M7卖疯了!仅24小时小订突破15万台 下一篇5.93mm全球最薄曲面屏手机!传音TECNO Slim系列正式发布
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持