游乐游手机版
首页/AI教程/文章详情

GLM5.1版超级玛丽功能亮点解析

时间:2026-06-16 18:57
GLM5 1生成的《超级马里奥》游戏能基本还原地图轮廓,操作逻辑可行且可通关,但跳跃高度异常,存在蘑菇叠放踩后掉命的bug。制作耗时28分钟,代码约1982行,虽优于多数模型,但与ClaudeFable的700多行代码和更高还原度相比仍有差距。

Claude Fable 5 轻松复刻经典版《超级马里奥》,还原度之高令人难以置信。

先来看一段演示视频。

视频播放完毕,或许有朋友觉得效果不过如此。但评判标准要看对比对象。昨天我们讨论了 MiMo 的表现,并顺带介绍了 MiMo Code。今天,我们来评估 GLM 5.1 能交出怎样的答卷。

从测试覆盖范围看,本次几乎囊括了国内外主流模型。坦白讲,AI 目前仍处于早期发展阶段,花一两年时间做各种测试对比,值不值得?非常值得。未来谁最了解顶级 AI,谁就能抢占先机。

回到《超级马里奥》这个案例。除了 Claude 旗下那款模型,整个测试中只有 GLM 5.1 的结果让人眼前一亮。

据闻 GLM 5.2 即将发布,我们先以 5.1 作为基准。等到 5.2 登场,再次测试,看看进步幅度。下面直接展示最终成果,然后分享制作流程——既要知其然,也要知其所以然。

效果展示

最终效果大致如下所示。

是不是有种“与众不同”的感觉?先列举它的亮点:

  • 地图轮廓基本能认出是马里奥风格。
  • 核心操作与游戏逻辑顺畅,中途不会卡死。
  • 能一路走到终点,成功通关。

仅这三点,就已经甩开不少模型了。再聊聊不太理想的地方:

  • 跳跃高度有些放飞,跳得极高,与原版物理逻辑相去甚远。
  • 地图细节与原版相比仍存在明显差距。
  • 还存在明显 bug:两个小蘑菇重叠在一起,一踩上去直接损失一条命。

它做到了几分,与 Fable 差距多大,相信一眼便知。Fable 的还原度堪称“大气层”——细节丰富、趣味性高,可在 TOPAI 上在线体验完整效果。

目前,8 个模型的测试结果已全部上传完毕。

制作过程

效果已经很直观了,下面看看制作过程——如何用一句话实现这样的效果?

工具依然是 Claude Code,通过 JCode 实现一键配置、一键启动、一键接入 GLM 5.1 官方 API。配置完成后,模型已设置为 GLM-5.1,思考强度为 Xhigh。

接着输入需求。需求描述很简单,细节让模型自行脑补——有时说得太清楚反而会限制发挥。一个回车下去,剩下的只有等待。

从截图可以看到,它整整思考了 6 分 23 秒才开始输出内容。这个时长有点久,但也不算离谱。最终花了 22 分钟完成整个游戏。整体耗时约 28 分钟,与 Claude Fable 接近。

为什么 GLM 5.1 的结果比其他模型还算不错?推测主要原因是它在过程中做了大量自检和修正。从整个对话历史能看到很多“检测、修正、验证”的环节。如今新一代模型和智能体普遍内置了这种自我验证机制。

交付清单如下:

清单标注:单文件、无依赖、约 1982 行。它做了多项状态检测,执行得相当到位。所以一直说,国内比较全面的模型,就是智谱的 GLM 系列,尤其是 5.0 之后的版本。

当然,与国际最顶尖的模型相比,差距依然存在。从代码行数就能看出端倪:Claude Fable 当时只用 700 多行就实现了更好的效果,而它用了将近 2000 行,几乎是三倍。写过程序的人都明白:同样的事情,用更少的代码实现,往往意味着更强的技术功底。多数情况下,精简代码本身就是极其困难的事,需要优化多种算法或业务逻辑。

GLM 5.1 这一波,相对而言确实还能看,就不多吐槽了。具体效果可以直接在网页上体验。想看源代码的话,右键即可查看,没有做压缩处理。

其他模型的效果也已一并上传。我们会逐一介绍,有兴趣可以先去试玩一下,真的很有意思。Claude Fable 是那种真正能玩的,直通四关。而有些模型,纯粹是来搞笑的,画面抽象得别有一番乐趣。

来源:https://juejin.cn/post/7650065510064390186
上一篇WorkBuddy实战建筑行业营销人AI办公自动化全攻略 下一篇AtomCode《谁去呀》微信小程序开发全流程
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
企业组织级AI赋能具体实施方法
AI教程 · 2026-06-30

企业组织级AI赋能具体实施方法

前段时间收到一位读者的留言,希望聊聊企业级、组织级的AI赋能究竟该怎么落地。巧的是,前几天刚看到一份咨询调研机构的数据:对近一两年所有企业级AI赋能项目的统计显示,超过90%的甲方企业认为,AI赋能在核心业务价值链上没有发挥任何实质性作用。除了AI辅助办公、企业智能知识库这类边缘应用起到了一些辅助效

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统
AI教程 · 2026-06-30

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统

从事日本电商数据聚合工作时,最大的难点在于要同时应对雅虎拍卖、煤炉(Mercari)、乐天和亚马逊日本站等截然不同的平台。以往使用单机爬虫,经常出现运行中崩溃的情况——单点故障、带宽利用率不足、数据存储混乱,这三大痛点令人困扰。 本文分享一套基于Scrapy + Redis的分布式爬虫方案,专门解决

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置
AI教程 · 2026-06-30

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置

​ PuTTY(简称PT)是一款轻量级开源SSH Telnet客户端,凭借简洁高效的特性,多年来始终是系统管理员与开发者进行远程连接的首选利器。本教程将详细介绍PuTTY 0 81版本的完整安装过程,并指导您自定义安装路径,以便更灵活地管理SSH远程连接工具。 安装准备 首先需要说明的是,整个安装流

在线教育系统必备功能:直播课堂与题库考试架构
AI教程 · 2026-06-30

在线教育系统必备功能:直播课堂与题库考试架构

很多人一想到做在线教育系统,第一反应往往是先把直播间和课程播放器搭起来,觉得“能看课”就万事大吉了。真到落地那天才发现,系统能不能顺滑跑起来,关键全藏在那些细节里——课程怎么组织、学习进度怎么记、考试怎么处理、后台怎么管得住。前端看起来就几个页面,后端其实是一整条业务链路。不管你是要做在线教育APP

ZStack源码级AI诊断套件让故障排查秒出答案
AI教程 · 2026-06-30

ZStack源码级AI诊断套件让故障排查秒出答案

一次故障排查,到底要花多少时间? 运维人员处理私有云、虚拟化平台的问题,流程大致都是这样:先翻日志看现象,再去文档里找对应机制,然后搜社区有没有类似案例,最后综合判断给出答复。简单问题半小时,复杂问题可能要跨天——而这些时间里,大部分精力耗在了“找信息”而不是“做决策”上。 类似的问题,也许每天都在