全球首场AI投资大赛收官:中国模型全盈利,美国全亏损,GPT-5亏超62%
11月4日,备受关注的AI大模型实盘投资大赛“Alpha Arena”正式落下帷幕。这场由第三方机构Nof1于10月18日启动的赛事,历经17天的激烈角逐,终于揭晓最终战果。
据了解,本次投资大赛云集了当前全球六大顶尖模型,包括Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5以及Grok 4。
比赛规则设定为每个模型获得一万美元初始资金,在真实金融市场中完全自主决策、独立交易,整个过程无人为干预,最终根据盈亏情况决出冠军归属。
赛事前半程,DeepSeek v3.1始终保持着领先优势。不过马斯克旗下的Grok 4凭借其激进的投资策略,一度将差距缩小至仅1美元,竞争异常胶着。
然而,10月21日至22日成为整场赛事的转折点。这两日内,Grok 4和Claude Sonnet 4.5的收益率大幅下滑,由盈转亏。到了10月22日当天,六大模型的收益率更是一度全线告负。
关键时刻,DeepSeek v3.1与Qwen3-Max自动调整了投资策略,在其余四个模型持续亏损的情况下脱颖而出。它们的净值曲线呈现波动上升态势,Qwen3-Max更是一度反超DeepSeek v3.1。
最终,截至11月4日比赛闭幕时,Qwen3-Max以1.22万美元的佳绩,凭借超过20%的收益率摘得桂冠,DeepSeek v3.1则以1.049万美元的成绩位居次席。
值得注意的是,这两个中国模型成为赛事中唯二实现盈利的选手,而四大美国顶尖模型则全部亏损,其中GPT-5亏损超过62%,表现垫底。

相关攻略
阿里发布Qwen3 7系列预览版模型。Qwen3 7-Max-Preview在大模型竞技场总榜位列第13,为当前国产模型最高排名,在数学等细分榜单表现突出。实测显示,该模型响应更快,在数学推理、编程及视觉任务上能力提升明显,能解答奥赛难题并生成应用。Qwen3 7-Plus-Preview在视觉榜单排名第16,展现出较强的图像理解与界面复刻能力。系列模型正转
11月4日消息,据媒体报道,由第三方机构Nof1于10月18日发起的AI大模型实时投资比赛“Alpha Arena”,历时17天,在今日落下帷幕。据了解,该项投资比赛集合Qwen3-Max、Deep
11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2 5-VL位列头两名,超越Gemini 3、GPT-5 1、Cl
11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2 5-VL位列头两名,超越Gemini 3、GPT-5 1、Cl
11月24日消息,今日,阿里巴巴宣布千问APP公测第一周即突破1000万下载。而这一速度也成功超越ChatGPT、Sora、DeepSeek,成为史上增长最快的AI应用。目前,千问App已支持多模态
热门专题
热门推荐
摘要由实在Agent通过智能技术生成。此内容由AI根据文章内容自动生成,并已由人工审核。 随着企业数字化转型进入智能体(Agent)驱动的新阶段,如何平衡AI创新与安全合规成为关键挑战。尤其在《网络安全等级保护基本要求》(等保2 0)的严格框架下,企业级智能体的部署必须同时满足效率提升与合规保障的双
使用情景 对于外贸从业者来说,年终总结绝非简单的例行汇报。它是一次至关重要的年度复盘与战略规划,既要系统梳理过去一年的业绩成果与经验得失,也要为来年的市场开拓与业务增长指明清晰路径。在全球贸易竞争白热化的今天,一份逻辑严谨、数据详实、洞察深刻的总结报告,不仅是个人专业能力的集中体现,更是赢得管理层支
使用情景 又到年末了,年度安全工作总结是每个团队都绕不开的环节。这份总结的价值,远不止于一份简单的回顾。它更像是一份“体检报告”,清晰地告诉你过去一年安全工作的“健康状况”——哪里做得好,哪里还有隐患,从而为来年的精准施策打下坚实的基础。 不过,说起写总结、做PPT,不少人就开始头疼了:内容怎么组织
Zcash (ZEC) 月度暴涨520%:深度解析后市行情与关键点位 近期,隐私币龙头Zcash (ZEC) 上演了一场令人瞩目的行情,月度涨幅高达520%,价格一度逼近300美元,创下自2021年12月以来的新高。在加密市场整体承压的背景下,ZEC的逆势狂飙吸引了全球投资者的目光。本文将结合技术分
在存量竞争的时代,电商售后数据早已超越了“成本中心”的单一角色,它正成为洞察产品质量、优化物流链路、提升用户忠诚度的核心战略资产。然而,现实往往骨感:多平台、多店铺、多套ERP系统并存,数据散落一地。靠人工手动汇总?不仅耗时费力,更关键的是,你永远无法实现真正的实时预警与敏捷响应。那么,电商售后数据





