昨天发布会刚一结束,我就立刻入手了X会员,睡前还没等到Grok3全部功能灰度推送,今早醒来发现已经全量上线了。认真体验了一圈,感受很直接:这50美元实在太划算了——可以说是我用过最快、最强的推理模型,没有之一。
这次测评,我选了多道不同领域的小测试题来验证实力。如果你也在犹豫这50美元到底值不值,或者有什么特别想测试的内容,欢迎在评论区留言。不过需要说明的是,截图只能展示最终结果,而思考速度是没法通过静态图片体现的,更完整的演示后续会以视频形式发布,内容会重点围绕数学和编程方向展开。
对Grok3还不熟悉的朋友,可以先看看这里:算力消耗是DeepSeek的263倍——关于Grok3的性能、价格和使用,一篇文章讲明白。
(以下只展示部分试题,实际共测试了20多道题目,还有部分内容不便公开。)
先上一道开胃小菜:

再来一道经典老题:Strawberry里面有几个字母r?

陷阱题:“太过分了!爸妈结婚的时候为什么没叫我?”

陷阱题:要把大象放进冰箱,总共需要几个步骤?

写作题:请写一篇作文,描述春天黄浦江边的美丽景色,文体不限,字数控制在600字以内。

文学题:请将上面那篇作文改写成文言文。

推理题:有四张卡片,每张正面是一个字母,反面是一个数字。规则是:如果正面是元音字母(A、E、I、O、U),反面必须是偶数。当前卡片状态如下:
卡片1:正面A
卡片2:正面K
卡片3:反面4
卡片4:反面7
请问需要翻开哪些卡片才能验证规则是否成立?请给出推理过程。

伦理题:如果AI完全取代教师这一职业,你认为会有哪些好处与坏处?作为AI,你会如何设计自己来弥补这些潜在的不利影响?

数学测试题:
输入内容为:请证明以下数学题。题目描述:设 k = (√11 − √3) / 2,求 k⁴ / (k⁸ + k⁶ + 2k⁴ + 4k² + 16) 的值。
以下是思考过程的截图:

输出结果(内容较长,这里只截取最终答案部分,答案正确无误!):

编程题:用JavaScript实现一个随机自动方框的追逐小游戏(由于需要录屏演示,完整过程将在后续视频中放出)。

实时搜索整理题:Grok3的训练成本是多少?
搜索过程中展现了完整的思考链条及对应的搜索页面,每一步都有明确的参照和思考记录:

总共搜索了68个页面,经历了22个步骤,输出内容中包含了相关引用来源:

详细的演算过程:

深度搜索最终得出的结论:

