游乐游手机版
首页/AI教程/文章详情

Minimax M2.5首个牛马模型实测搭建特斯拉股票交易系统

时间:2026-06-01 06:55
绝大多数人对 AI 的耐心,正在消失。过去两年,我们似乎陷入了一个巨大的误区。每一次新模型发布,大家都在盯着榜单看。MMLU 多少分?数学推理是不是第一?参数量是不是又大了?但每天处理大量业务的创业者心里清楚:这些分数与真实工作流是割裂的。真正在乎的,不是它能不能做奥数题,而是它能不能像一个真正的「

绝大多数人对 AI 的耐心,正在消失。

过去两年,我们似乎陷入了一个巨大的误区。

每一次新模型发布,大家都在盯着榜单看。MMLU 多少分?数学推理是不是第一?参数量是不是又大了?

但每天处理大量业务的创业者心里清楚:这些分数与真实工作流是割裂的。真正在乎的,不是它能不能做奥数题,而是它能不能像一个真正的「员工」那样,接过手里那些繁琐、枯燥甚至复杂的任务,并且按时交付。

昨天,Minimax 发布了 M2.5,官方给它贴的标签很有意思:Workhorse Model(主力生产力模型)+ 100 TPS(每秒处理100个Token的疯狂速度)。

horse?这不妥妥的牛马模型吗?

于是抓了几个真实的办公室场景,看看它到底是不是「白领生产力」。

结果非常意外。

不是因为完美,而是因为它展现出了一种极其可怕的「执行惯性」。

01

深度结合Office 三件套

第一个任务,扔给它一份 80 多页的PDF《2025年跨境电商行业年度报告》。

这通常是公司里初级分析师最头疼的工作:阅读几十页的原始资料,提取数据,然后重构成一份新的、符合公司品牌调性的 Word、Excel 和 PPT。

令人惊讶的不是内容的准确性,而是它对「文档工程」的理解。

先看Word的实力。提示词是这样写的:

附件《2025年跨境电商行业年度报告-AMZ123-202601.pdf》我们是 NGS 全称是 NextGrowthSail Ltd,是帮助国内品牌做出海营销的机构,目前主营 Reddit 代运营、GEO (AI SEO)的服务。我们也想出一个类似的品牌出海营销报告。现在需要你帮我完成这个任务。首先需要你把这个 pdf读一遍,把其中关于「品牌营销」「市场营销」「社交媒体」「Reddit」「SEO」「GEO」「AI」相关的内容都抓出来,尤其是数据。写到一个Word 文档里,重新写成《2025 NGS品牌出海营销洞察报告》,要求图文并茂。所有内容都不能你自己捏造,要求注明来自原 pdf 的第几页哪个位置,如果是外部的引用也要给出详细具体的网址,确保真实可靠性。

直接在MiniMax 页面 Agent 里测的:

在子袋里把 office 相关能力火力全开:

结果还真靠谱,既有「插入目录」

又有封面、页头页尾、表格,排版完成度很高,非常省事。

这种对文档结构的还原能力,意味着它已经脱离了“文本生成”的范畴,进入了“文档处理”的领域。

接着看Excel能力怎么样。提示词:

接下来,把 word 里的所有表格数据都整理到 Excel 里的多个 sheet,并且做透视表、图表等「进阶操作」使得 Excel 看起来很复杂、老板很喜欢看。

排版不错,Excel 的表格也美化了。

图表也能做好。

这就是 Minimax 强调的 Workhorse Model(主力模型)能力。在处理 docx、xlsx 这种核心生产力格式上,它确实跨过了一个门槛:从生成内容,变成了生成交付物。

当然,槽点也有。当让它基于这些数据生成 PPT 时,虽然内容逻辑是对的,但那个审美和排版……

这是我们 NGS 出海营销的 logo,接下来需要你设计配色,基于前面的 word、Excel 做一份 pptx 报告,要有欧美品牌的高逼格审美,内容详实、数据可信。

整体来说还行,但如果论 AI 生成 PPT 而言,仿佛还是上一代的产品。

完整 PPT 报告:xqmenq48tn6h.space.minimaxi.com/

这揭示了一个真相:在结构化和逻辑严谨的工作(Word 和 Excel)上,M2.5 已经是行业 SOTA(领先)水平;但在需要审美和创意的PPT环节,它依然需要人类去把关。

02

AI 数据分析:速度提高 73%

如果说 Office 三件套是基础题,那接下来的任务就是附加题。

扔给它两份脏乱差的亚马逊竞品评论数据(xlsx),要求它扮演一位“商业洞察分析师”,写 Python 脚本进行清洗、情感分析,并输出一份 HTML 格式的深度交互报告。

注意,这不是简单的总结,而是需要 Coding 能力介入的深度数据挖掘。同类的任务,半年前用其他顶级模型跑过,耗时半小时以上。看原文设计的提示词就知道需求有多复杂。

但这一次,Minimax M2.5 只用了8 分钟。

整体的报告是到位的。

可视化效果很好。

排版真不错,图下面给了解读。

Prompt 的要求也遵循得很好。

这验证了 M2.5 的一个核心逻辑:Coding 能力的下放。它不再只是程序员的工具,而是变成了业务人员的数据铲子。你不需要懂 Python,你只需要懂业务,它就能帮你把数据变成结论。

03

全栈开发一个美股模拟交易系统

前两个 Case 还是在处理静态文件,最后这个 Case,测的是它的Agentic(智能体)能力。

要求它开发一个「特斯拉股票与舆情监控 AI 系统」。这极其复杂:

  1. 1.前端:要用 React 写一个特斯拉风格的仪表盘。
  2. 2.后端:要连接真实的新闻数据源和股票接口。
  3. 3.数据库:要连接 Supabase,记录交易数据。
  4. 4.Agent:AI 要自己根据舆情判断买卖,并自动执行操作。

参考提示词:

独立开发一个企业级的「特斯拉股票与舆情监控AI系统」就只看特斯拉这只美股股票,左边是 K 线趋势可能占 60%,右边40% 是「马斯克」这个人和「特斯拉」的相关最新的新闻滚动分析并且右边给出买卖的决策建议,需要有美股价值投资、短期投机的理论支撑。并且自带一个「模拟交易」系统的后端,让 AI 自动根据收集到的舆情信息、对特斯拉股票的技术分析等,自行去交易,记录下关键的操作的时间、金额等核心数据,用于后续复盘策略。所以你要判断这个前后端项目需要什么、需要真正能长期跑起来、并且审美高级好看、符合特斯拉风格的。我已经连好 supabase 数据库了,接下来就交给你了。

Minimax 现在的 Agent 平台直接内置了 Supabase 支持,大大降低了门槛。

老实说第一次问题不小,页面需要下拉,导致 K 线图被拉变形了。

好在一次就改好了。

(图注:左侧是实时的 K 线,右侧是 AI 分析出的舆情与决策建议)

右边的模块包含三个部分:理论、舆情监控、模拟交易。

感兴趣可以试试:7y35p3ao81zr.space.minimaxi.com/

整体前后端是通的。例如操作一下,买 10 股特斯拉。

数据库马上有记录了,余额也对得上。

这意味着什么?意味着 AI 不再是只能在对话框里口嗨的“大脑”,它有了“手”。它可以通过数据库、通过API,去真实地触碰这个数字世界。

Designed for Agent-verse(为智能体生态设计),在 M2.5 身上不是一句空话。它极强的任务规划能力和长链路执行力,让它能够像一个资深全栈工程师一样,自己去 Debug,自己去调优。

04

结论:效率即正义

三个 Case 跑完,最大的感受其实不是“智能”,而是“快”。

官方数据说 M2.5 支持100 TPS的超高吞吐量,推理速度是 Claude Opus 的 3 倍。在实际体验中,这种“快”带来了质变。当 AI 写代码像流式输出一样快,当它生成一份万字报告只需要几十秒时,试错成本被无限降低了。

PPT 丑了?两句话让它重做。代码报错了?一秒钟让它修复。这才是 AI 融入工作的真实路径:它不需要一次就做到 100 分,它只需要以人类 10 倍的速度拿出 80 分的初稿,然后陪你快速迭代到 95 分。

来源:https://juejin.cn/post/7623634379211161652
上一篇Copilot CLI v1.0.35 新增终端 Tab 自动补全 下一篇AI赋能航天造物:LEAP71火箭发动机计算工程软件开发全解析
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
SVD奇异值分解的三步:双对角化、Givens收敛与排序
AI教程 · 2026-07-01

SVD奇异值分解的三步:双对角化、Givens收敛与排序

写在前面:万能的 SVD,缺席的算法SVD 是线性代数的瑞士军刀。你做主成分分析(PCA),底层是 SVD;你做推荐系统的协同过滤,底层是 SVD;你算伪逆、解最小二乘,底层是 SVD;你做图像压缩、信号去噪、潜在语义分析(LSA),底层还是 SVD。统计软件里凡是涉及 "降维 " "求秩 " "解超定方程组

大模型位置编码深度解析:模型如何理解顺序?
AI教程 · 2026-07-01

大模型位置编码深度解析:模型如何理解顺序?

注意力机制的“位置盲区” 上一章我们探讨了注意力机制如何借助 QKV(Query-Key-Value)矩阵计算 Token 之间的相关性。然而,其中隐藏着一个关键的问题: 注意力机制天生就像个“路痴”——它根本无法感知 Token 的前后顺序! 问题演示 我们来观察这两个句子: "猫 吃 鱼 " "鱼

深度学习从零理解Transformer模型原理与架构详解
AI教程 · 2026-07-01

深度学习从零理解Transformer模型原理与架构详解

从零理解 Transformer:注意力机制全解析 Transformer 架构彻底改写了自然语言处理的技术版图——从 BERT 到 GPT-4,从 T5 到 LLaMA,几乎所有现代大语言模型都长在 Transformer 的根上。但说实话,很多开发者的理解还停在“调 API”层面。本文从直觉出发

Rust构建AI自演化主板:18个异构器官长出C++骨骼
AI教程 · 2026-07-01

Rust构建AI自演化主板:18个异构器官长出C++骨骼

用 Rust 手搓 AI 自演化主板:当 18 个异构器官长出 C++ 骨骼第一章 物理层:让 Rust C++ CUDA 共享同一根血管在多语言实时系统开发中,最棘手的难题莫过于数据拷贝。一个 MarketTick 信号若从 Rust 传递至 C++ 算子,再送入 CUDA 核函数,最后返

大模型可观测性升温:响应时间、Token与调用链成AI系统新指标
AI教程 · 2026-07-01

大模型可观测性升温:响应时间、Token与调用链成AI系统新指标

2026年,大模型应用正迈入全新阶段:核心关注点从“功能是否可用”转向“运行是否稳定”。 回顾过往,大家对大模型的注意力基本集中在模型效果本身——回答准确度如何、生成速度快慢、能否对接知识库、是否支持多轮对话。这些固然是基础能力,但当模型真正嵌入客服、办公、研发、运维、数据分析等核心业务场景后,新的