游乐游手机版
首页/AI教程/文章详情

Minimax M2.5首个牛马模型实测搭建特斯拉股票交易系统

时间:2026-06-01 06:55
绝大多数人对 AI 的耐心,正在消失。过去两年,我们似乎陷入了一个巨大的误区。每一次新模型发布,大家都在盯着榜单看。MMLU 多少分?数学推理是不是第一?参数量是不是又大了?但每天处理大量业务的创业者心里清楚:这些分数与真实工作流是割裂的。真正在乎的,不是它能不能做奥数题,而是它能不能像一个真正的「

绝大多数人对 AI 的耐心,正在消失。

过去两年,我们似乎陷入了一个巨大的误区。

每一次新模型发布,大家都在盯着榜单看。MMLU 多少分?数学推理是不是第一?参数量是不是又大了?

但每天处理大量业务的创业者心里清楚:这些分数与真实工作流是割裂的。真正在乎的,不是它能不能做奥数题,而是它能不能像一个真正的「员工」那样,接过手里那些繁琐、枯燥甚至复杂的任务,并且按时交付。

昨天,Minimax 发布了 M2.5,官方给它贴的标签很有意思:Workhorse Model(主力生产力模型)+ 100 TPS(每秒处理100个Token的疯狂速度)。

horse?这不妥妥的牛马模型吗?

于是抓了几个真实的办公室场景,看看它到底是不是「白领生产力」。

结果非常意外。

不是因为完美,而是因为它展现出了一种极其可怕的「执行惯性」。

01

深度结合Office 三件套

第一个任务,扔给它一份 80 多页的PDF《2025年跨境电商行业年度报告》。

这通常是公司里初级分析师最头疼的工作:阅读几十页的原始资料,提取数据,然后重构成一份新的、符合公司品牌调性的 Word、Excel 和 PPT。

令人惊讶的不是内容的准确性,而是它对「文档工程」的理解。

先看Word的实力。提示词是这样写的:

附件《2025年跨境电商行业年度报告-AMZ123-202601.pdf》我们是 NGS 全称是 NextGrowthSail Ltd,是帮助国内品牌做出海营销的机构,目前主营 Reddit 代运营、GEO (AI SEO)的服务。我们也想出一个类似的品牌出海营销报告。现在需要你帮我完成这个任务。首先需要你把这个 pdf读一遍,把其中关于「品牌营销」「市场营销」「社交媒体」「Reddit」「SEO」「GEO」「AI」相关的内容都抓出来,尤其是数据。写到一个Word 文档里,重新写成《2025 NGS品牌出海营销洞察报告》,要求图文并茂。所有内容都不能你自己捏造,要求注明来自原 pdf 的第几页哪个位置,如果是外部的引用也要给出详细具体的网址,确保真实可靠性。

直接在MiniMax 页面 Agent 里测的:

在子袋里把 office 相关能力火力全开:

结果还真靠谱,既有「插入目录」

又有封面、页头页尾、表格,排版完成度很高,非常省事。

这种对文档结构的还原能力,意味着它已经脱离了“文本生成”的范畴,进入了“文档处理”的领域。

接着看Excel能力怎么样。提示词:

接下来,把 word 里的所有表格数据都整理到 Excel 里的多个 sheet,并且做透视表、图表等「进阶操作」使得 Excel 看起来很复杂、老板很喜欢看。

排版不错,Excel 的表格也美化了。

图表也能做好。

这就是 Minimax 强调的 Workhorse Model(主力模型)能力。在处理 docx、xlsx 这种核心生产力格式上,它确实跨过了一个门槛:从生成内容,变成了生成交付物。

当然,槽点也有。当让它基于这些数据生成 PPT 时,虽然内容逻辑是对的,但那个审美和排版……

这是我们 NGS 出海营销的 logo,接下来需要你设计配色,基于前面的 word、Excel 做一份 pptx 报告,要有欧美品牌的高逼格审美,内容详实、数据可信。

整体来说还行,但如果论 AI 生成 PPT 而言,仿佛还是上一代的产品。

完整 PPT 报告:xqmenq48tn6h.space.minimaxi.com/

这揭示了一个真相:在结构化和逻辑严谨的工作(Word 和 Excel)上,M2.5 已经是行业 SOTA(领先)水平;但在需要审美和创意的PPT环节,它依然需要人类去把关。

02

AI 数据分析:速度提高 73%

如果说 Office 三件套是基础题,那接下来的任务就是附加题。

扔给它两份脏乱差的亚马逊竞品评论数据(xlsx),要求它扮演一位“商业洞察分析师”,写 Python 脚本进行清洗、情感分析,并输出一份 HTML 格式的深度交互报告。

注意,这不是简单的总结,而是需要 Coding 能力介入的深度数据挖掘。同类的任务,半年前用其他顶级模型跑过,耗时半小时以上。看原文设计的提示词就知道需求有多复杂。

但这一次,Minimax M2.5 只用了8 分钟。

整体的报告是到位的。

可视化效果很好。

排版真不错,图下面给了解读。

Prompt 的要求也遵循得很好。

这验证了 M2.5 的一个核心逻辑:Coding 能力的下放。它不再只是程序员的工具,而是变成了业务人员的数据铲子。你不需要懂 Python,你只需要懂业务,它就能帮你把数据变成结论。

03

全栈开发一个美股模拟交易系统

前两个 Case 还是在处理静态文件,最后这个 Case,测的是它的Agentic(智能体)能力。

要求它开发一个「特斯拉股票与舆情监控 AI 系统」。这极其复杂:

  1. 1.前端:要用 React 写一个特斯拉风格的仪表盘。
  2. 2.后端:要连接真实的新闻数据源和股票接口。
  3. 3.数据库:要连接 Supabase,记录交易数据。
  4. 4.Agent:AI 要自己根据舆情判断买卖,并自动执行操作。

参考提示词:

独立开发一个企业级的「特斯拉股票与舆情监控AI系统」就只看特斯拉这只美股股票,左边是 K 线趋势可能占 60%,右边40% 是「马斯克」这个人和「特斯拉」的相关最新的新闻滚动分析并且右边给出买卖的决策建议,需要有美股价值投资、短期投机的理论支撑。并且自带一个「模拟交易」系统的后端,让 AI 自动根据收集到的舆情信息、对特斯拉股票的技术分析等,自行去交易,记录下关键的操作的时间、金额等核心数据,用于后续复盘策略。所以你要判断这个前后端项目需要什么、需要真正能长期跑起来、并且审美高级好看、符合特斯拉风格的。我已经连好 supabase 数据库了,接下来就交给你了。

Minimax 现在的 Agent 平台直接内置了 Supabase 支持,大大降低了门槛。

老实说第一次问题不小,页面需要下拉,导致 K 线图被拉变形了。

好在一次就改好了。

(图注:左侧是实时的 K 线,右侧是 AI 分析出的舆情与决策建议)

右边的模块包含三个部分:理论、舆情监控、模拟交易。

感兴趣可以试试:7y35p3ao81zr.space.minimaxi.com/

整体前后端是通的。例如操作一下,买 10 股特斯拉。

数据库马上有记录了,余额也对得上。

这意味着什么?意味着 AI 不再是只能在对话框里口嗨的“大脑”,它有了“手”。它可以通过数据库、通过API,去真实地触碰这个数字世界。

Designed for Agent-verse(为智能体生态设计),在 M2.5 身上不是一句空话。它极强的任务规划能力和长链路执行力,让它能够像一个资深全栈工程师一样,自己去 Debug,自己去调优。

04

结论:效率即正义

三个 Case 跑完,最大的感受其实不是“智能”,而是“快”。

官方数据说 M2.5 支持100 TPS的超高吞吐量,推理速度是 Claude Opus 的 3 倍。在实际体验中,这种“快”带来了质变。当 AI 写代码像流式输出一样快,当它生成一份万字报告只需要几十秒时,试错成本被无限降低了。

PPT 丑了?两句话让它重做。代码报错了?一秒钟让它修复。这才是 AI 融入工作的真实路径:它不需要一次就做到 100 分,它只需要以人类 10 倍的速度拿出 80 分的初稿,然后陪你快速迭代到 95 分。

来源:https://juejin.cn/post/7623634379211161652
上一篇Copilot CLI v1.0.35 新增终端 Tab 自动补全 下一篇AI赋能航天造物:LEAP71火箭发动机计算工程软件开发全解析
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
AI接入指南:API调用到本地部署全解析
AI教程 · 2026-06-01

AI接入指南:API调用到本地部署全解析

从AI的发展历程说起。如今AI工具已经渗透到方方面面,但多数人只是通过网页或App来使用——就像开一辆车,会踩油门就能到达目的地。然而,如果想把这台 "发动机 "拆下来,装到自己的项目里,甚至造出一辆更符合特定任务的 "专用车 ",那就得走另一条路了:API接入大模型。 ​编辑 为什么需要API接入云端大模

避免Agent技能过多,别将Prompt塞成能力清单
AI教程 · 2026-06-01

避免Agent技能过多,别将Prompt塞成能力清单

摘要 首先分享一个许多团队常见的误区——不少人一开始就想当然地认为,Agent 的 Skill 装得越多,其能力就越强。于是,工具说明、操作流程、检查清单、模板规则……全部一股脑地塞进系统 Prompt。结果呢?Agent 非但没有变得更聪明,反而在工具选择上更加飘忽不定,关键 Skill 经常无法

Talo AI视频会议翻译工具
AI教程 · 2026-06-01

Talo AI视频会议翻译工具

在全球协作日益紧密的当下,语言壁垒依然是许多跨国团队面临的棘手难题。传统翻译方式往往成本高昂、效率低下且操作繁琐。不过,最近我们发现了一款名为Talo的AI工具,有望让跨语言沟通变得前所未有的简单。 Talo是什么 Talo是一款专为视频通话场景打造的实时AI语音翻译工具,其核心价值在于为跨国视频会

可审计幂等受控CLI操作OA比AI点网页更快更稳更安全
AI教程 · 2026-06-01

可审计幂等受控CLI操作OA比AI点网页更快更稳更安全

引言:OA 自动化的真实困境 每天早上9点,某公司行政部的小张都要处理近20条请假申请核对——员工们在OA网页上填错日期、漏选假种、忘记附理由是家常便饭;而研发部的小李,为了把“每月考勤对账”接入自动化流程,熬夜写了N套浏览器脚本,结果OA前端一改版,脚本全军覆没,还得从头调试DOM元素;更糟的是,

全网导航网 一站式精选优质上网导航大全
AI教程 · 2026-06-01

全网导航网 一站式精选优质上网导航大全

全网导航是什么?在互联网信息高度发达的今天,你是否也常常因找不到合适的网站入口而感到困扰?全网导航正是专为解决这一需求而打造的聚合平台。它整合了800多个优质导航网站资源,涵盖传统导航、垂直导航、行业导航、AI导航、地域导航等多种类别。不论你需要常用工具、行业资料,还是想了解AI前沿技术或地域特色信