谷歌推出年度重磅AI模型,实测可替代macOS版GPT-5
还记得不久前我们介绍过一波 Google AI 全家桶吗?那会儿正值 nano banana 爆火,Gemini 登上榜首。许多人因此第一次去尝试了 Gemini 2.5 Pro,结果发现这个不声不响的旗舰模型,很多时候居然比 GPT-5 还要出色。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
现在,更强大的 Gemini 3.0,已经在 Google AI Studio 的测试里"提前上线"了。
网友们发现,它的能力提升不止一星半点,能直接用一套简单的提示词生成一个网页版 Windows、macOS 等操作系统。
大量的测试结果都提到,Gemini 3 写的代码能够直接运行,前端设计也更加成熟,甚至能做出剪辑视频、刷短视频的工具。
这次改进,可能是 Gemini 在图像编辑领域之外,再次超越 Claude 和 GPT-5 的关键时刻。
不过,这到底是为了营销制造的噱头,还是真能改变我们的使用体验?不如先跟我们一起看看这些网友分享的 Gemini 3 案例吧。
着手就写一个 Windows?
就像 nano banana 在判断生图能力时采用的指标,是看这个模型在生成文字时的表现。
而如何判断一个基础模型的交付能力,编程这种一旦代码里有个轻微错误就无法运行的项目,成了大部分基础模型厂商专攻的方向。一开始在这反面表现不错的 Claude,也因此赚到了一定的声量。
选择 Agentic Coding Average(智能体编程任务平均得分)后,模型排行榜上,Claude Sonnet 4.5 位于第一名。来源: https://livebench.ai/
近期多个博主在 X 上爆料,即将推出的 Gemini 3,在多个编程任务上的真实表现,不用说击败 GPT-5,甚至有直接超越 Claude 的趋势。
Google AI Studio 负责人 Logan 也在 X 上回复网友,确认了 Gemini 3 拥有工具调用的能力,即我们常说的智能体。
以往的编程测试,大多数集中在对逻辑能力的理解,比如一个小球在六边形框框里面流动的物理测试;对前端能力的审美把握,观察 AI 生成的是否足够交互友好,页面现代化;还有一些实用型的小游戏或小工具等。
这次放出来的部分 Gemini 3 测试,完全可以说是测试样例的一次大升级。
X 博主 chetaslua 分享了多个由 Gemini 3 完成的编程任务。它能直接给我们生成一个 macOS 的网页版电脑,在这个网页里,就像是在操作一台云电脑。所有的应用程序都可以打开,点击 Safari 的图标可以进入浏览器,并在网页里继续访问。
prompt: Design and create a web os like macOS full functional features from text editor , terminal with python and code editor and a game that can be played to dile manager to paint to video editor and all important windows os pre bundled software Use whatever libraries to get this done but make sure I can paste it all into a single HTML file and open it in Chrome.make it interesting and highly detail , shows details that no one expected go full creative and full beauty in one code block 提示词:设计并创建一个类似 macOS 操作系统的全功能网络操作系统,从文本编辑器、带 Python 的终端和代码编辑器开始,并包含一个可玩的游戏,用于文件管理器、绘图、视频编辑器以及所有重要的 Windows 操作系统预装软件。使用任何库来完成这个任务,但确保我能够将所有内容粘贴到一个单一的 HTML 文件中,并在 Chrome 中打开它。使其有趣且高度详细,展示没有人预期到的细节,在一个代码块中实现完全的创意和美感。
源码: https://codepen.io/ChetasLua/pen/yyezLjN
来源:https://x.com/chetaslua/status/1977866953705316571
不仅 macOS 云电脑能生成,博主还用同样的提示词,修改成 Windows、Linux、以及云手机等操作系统,开机动画、系统内操作,同样能完美还原。
而且,Gemini 3 在处理这些编程任务时,速度也得到了提升。根据博主在评论区的回复,Gemini 3 的推理速度在 1-2 分钟。
当把同样的提示词交给 Claude Sonnet 4.5 处理,网友分享的结果是,Claude 只是生成了一个页面,所有的应用程序都不能点击打开。我也测试了一下 GPT-5 的能力,虽然它可以打开某些应用,但是打开之后,就没有下一步的处理逻辑了。
https://x.com/pallavmac/status/1977979879489679640
还有一个小彩蛋,在网页打开的云电脑里面,点击终端,输入 matrix,我们会看到类似黑客帝国电影海报的 01 流动代码,可以说是对 The Matrix Revolution(黑客帝国电影港版译名)的真实还原了。
除了这几个热门的系统还原测试,Gemini 3 的编程能力,也体现在它的前端也有了其他 AI 模型做不到的进步。最明显的就是 AI 编程容易出现的"渐变紫",Gemini 3 终于摆脱了。
x@Liam06972452,提示词:Write full HTML, CSS and JavaScript for a stunning, bold, creative and unique landing page for a website about llms. It should look like it was built from scratch by a world-leading web design agency。
就像这个关于大语言模型的 ,输入的提示词仅仅是「为关于 LLMs 的 编写完整的 HTML、CSS 和 JavaScript,以创建一个令人惊叹、大胆、富有创意和独特的着陆页。它应该看起来像是由世界顶尖的网页设计公司从头构建的。」
网友们纷纷在评论区说,Gemini 3 一定有专门的设计师在合作,还有人预测 Gemini 3 将在前端领域,像 nano banana 一样占据主导地位。
不过也有人认为 Gemini 3 的前端,还是存在一些问题。尽管它解决了那些讨厌的渐变,改变了大多少 AI 模型长期以来一直在做的同样事情,但 3.0 的前端总是黑色的,除非明确提示。在我看来,黑色比渐变好太多, 的设计就应该简洁大方。
基于能一句话写出一个系统,还有优秀前端能力的 Gemini 3,还可以生成一个在线的视频编辑器,当然也是真的能够剪辑视频。
提示词:create amazing single html page video editor that WORKS! make it amazing。(创建一个令人惊叹的单一 HTML 页面视频编辑器,它必须能正常工作!让它变得非常棒。) 来源:https://x.com/sbalhatlani/status/1977501190322549017 CodePen 可运行体验链接:https://codepen.io/DiNaSoR/pen/WbrEELE
一个能无限刷短视频的抖音 App 网页版。
来源:https://www.reddit.com/r/Bard/comments/1o67jz4/crazy_google_gemini_30_pro_just_built_a_perfect/
体验地址:https://jsbin.com/yisixokuwi/1
那些做 vibe coding、一键生成网页应用工具的 Lovable、Cursor 等,可能要考虑默认模型换成 Gemini 3 了。
在经典的代码能力测试上,还有一个生成自行车图标的任务,比较模型对于 SVG 代码的生成效果。
Gemini 3 能生成普通的版本的鹈鹕。
https://x.com/whylifeis4/status/1974205929110311134
甚至还有游戏《我的世界》同款风格的 3D 版本。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





