全球首个AI投资大赛阿里千问夺冠,美国四大模型均亏损出局
11月4日,全球首个AI大模型实盘投资大赛“Alpha Arena”正式落下帷幕。经过17天激烈角逐,阿里千问Qwen以超过20%的收益率摘得桂冠,Qwen和DeepSeek两款中国模型成为仅有的实现盈利的选手,而美国四大顶尖模型全线亏损,其中GPT-5亏损幅度甚至超过60%,最终成绩垫底。

这项由专注于金融市场的AI实验室Nof1于10月18日发起的赛事,将多个AI大模型置于真实金融市场环境中进行自动化交易对抗。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型,为每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,以检验模型的实战交易能力。
赛事采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,确保竞赛的公平性和透明度。此外,Nof1还允许AI模型进行“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决定冠军归属。
比赛初期,六大模型表现相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek处于领先态势,屡次互换第一位置,始终稳居第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,虽偶有盈利,整体仍处于亏损状态;而GPT-5和Gemini 2.5 Pro两大模型则长期亏损,表现不尽如人意。

截至北京时间11月4日早上比赛结束,阿里千问最终超越DeepSeek,Qwen以超过20%的胜率获胜;DeepSeek实现盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均出现亏损,其中Gemini 2.5 Pro和GPT-5的亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。

有行业人士指出,阿里千问和DeepSeek在实战中的优异表现,证明了中国模型在解决实际问题上的强大潜力。AI对应用场景的深刻理解,将成为大模型落地和未来全球AI竞争的关键要素。
根据全球知名的大模型API三方聚合平台OpenRouter于7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额超越OpenAI的4.7%,位列第四。
OpenRouter推文显示,当下成长最快的前10大模型中有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。
而在今年9月,零一万物CEO李开复在长江CEO 20周年返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”
李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。
相关攻略
上海启动全球首颗光计算卫星研制,其天基光计算具备抗辐照、低功耗特性,适应太空环境,可支撑在轨大算力任务。目前芯片太空验证已完成,全链条研制能力基本形成。产业面临成本与规模化挑战,需重构航天制造体系。长三角已成立创新联合体聚焦七大技术攻坚,上海将天基计算列为未来。
5月14日晚间,陕西源杰半导体科技股份有限公司发布的一则公告引发资本市场广泛关注。公告披露,公司副总经理陈文君因涉嫌刑事犯罪已被公安机关采取刑事拘留措施,目前无法正常履行职务。 公司董事会反应迅速,于同日召开会议审议通过了关于解聘陈文君副总经理职务的议案,解聘决定自决议通过之日起生效。公告同时说明,
追觅“宇宙”:一场极限狂奔下的组织实验 2月4日晚,苏州奥林匹克体育中心被数万人填满。追觅科技以一场汇集韩红、李克勤等多位明星的年会,展示了它的不凡声势。开场前,创始人兼CEO俞浩登台许愿——这位1987年出生的清华毕业生,毫不掩饰自己的野心:一是将追觅打造为人类历史上最伟大的企业,二是让自己登上世
4月1日,记者获悉,美国半导体厂商安森美(onsemi)正式发布中国战略,宣布将上海设为大中华区总部,并计划任命兼任系统工程负责人的中国区总经理,以持续增强本土领导力与决策效率。安森美总裁兼首席执行
4月1日,独家获悉,原特斯拉中国区总经理孔艳双已入职小米,将接替原小米汽车总监李晓锐负责汽车销售方面工作。孔艳双于3月初入职,处于工作交接期,目前小米内部并未正式发文通告其正式职位。就以上消息向小米
热门专题
热门推荐
公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。
理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小
5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给
比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构





