6大AI模型金融实战测评：DeepSeek收益超14%，Gemini2.5爆亏

专注于金融科技领域的人工智能研究机构nof1近日宣布，其研发的大型模型交易实战项目Alpha Arena正式启动。该项目旨在通过真实市场环境检验主流AI大模型的交易决策能力和风险控制水平，测试平台选

专注于金融科技领域的人工智能研究机构nof1近日宣布，其研发的大型模型交易实战项目Alpha Arena正式启动。该项目旨在通过真实市场环境检验主流AI大模型的交易决策能力和风险控制水平，测试平台选定去中心化交易平台Hyperliquid，为参与模型打造高仿真的交易场景。

在严格控制的实验条件下，六款具备金融应用潜力的AI模型展开同台竞技。测试采用统一数据源和标准化提示词，确保所有模型在相同信息环境下运行。每款模型均获得1万美元真实资金进行独立操作，实验周期内完全自主执行交易策略，不受人工干预影响。

参与测试的模型阵容包括GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1和Qwen3Max等前沿产品。经过完整交易周期后，实验数据揭示出显著差异：DeepSeek V3.1与Grok-4表现尤为亮眼，双双取得超过14%的收益率并并列榜首；而Gemini2.5Pro则出现极端亏损情况，资金缩水达4257%，成为本次测试中最具戏剧性的结果。

项目负责人指出，Alpha Arena的核心价值不在于简单的模型排名，而是通过系统性压力测试，观察不同技术架构在极端市场波动中的策略适应性。实验重点关注模型的风险识别速度、仓位调整机制以及黑天鹅事件应对能力，这些指标对构建自主量化交易系统具有关键参考价值。

此次实战测试标志着AI技术应用边界的进一步拓展。从传统的文本处理与逻辑推理，到直接参与高风险金融决策，技术演进路径清晰可见。nof1团队强调，实验数据将为开发更稳健的AI交易系统提供重要依据，推动智能投顾技术向实战化、专业化方向迈进。

6大AI模型金融实战测评：DeepSeek收益超14%，Gemini2.5爆亏

相关推荐

同类最新

OpenClaw手机App上线，结果翻车了

优必选CEO周剑：家庭机器人生态核心投入过半精力

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

龙岗AR实景剧本游内测体验短板有效破解之道

南下资金6月30日净买入中芯国际与建滔积层板