首页 游戏 软件 资讯 排行榜 专题
首页
AI
Grok视频模型屠榜Arena,46.5万次盲测击败谷歌实力派

Grok视频模型屠榜Arena,46.5万次盲测击败谷歌实力派

热心网友
16
转载
2026-02-25


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:元宇

【新智元导读】马斯克亲自站台,grok-image-video-720p在46万次盲测投票中加冕第一,这款xAI「压箱底」的视频模型,不仅在基准测试上超过了谷歌Veo 3.1 Fast,使用成本也更低。

刚刚,AI视频领域又迎来洗牌!

xAI的Grok图像转视频模型(grok-image-video-720p)登顶「Image-to-Video Arena」排行榜,以1404分的超高ELO评分力压群雄,位居第一。

马斯克亲自发帖为自家Grok Image模型站台,称它每周都在迭代优化。


这次,xAI真是拿出了「压箱底」的东西,他们将Grok Imagine称作为自己目前最强悍的「视频+音频」生成模型。

无论是想让一张静态梗图「活」过来,还是凭空用一句话变出大片,甚至是对复杂的电影级镜头进行精细打磨,它都能轻松搞定。

X平台上,网友用Grok制作的视频已经迅速刷屏,涵盖电影特效、动画制作、日常生活等种种场景。

从一些基准测试上来看,Grok-imagine-video-720p不仅击败了谷歌强大的Veo模型,而且生成成本也更低。

有网友惊呼,这不仅是AI视频工具的一次进化,更可能直接推动该领域重新「排座次」。


还有网友猜想,Grok的强势出击,或将掀起新一轮生成式视频技术的军备竞赛。


揭秘Grok Imagine

能干活、成本低的多模态六边形战士

Grok Imagine是xAI倾力打造的视频-音频生成模型,该模型的最新版本Grok Imagine 1.0于2026年2月初发布。

支持生成10秒长的720p高清视频,并在运动平滑度、原生音频质量(如情感表达的声音)以及提示词遵循能力上均实现了跨越式升级。

相比较2025年10月发布的Imagine v0.9版本,它将核心聚焦于视觉质量、多模态能力,成本和延迟的平衡,真正做到了支持端到端的创意工作流。

用户可以通过文本描述或上传图像来动画化内容,还支持后续指令微调场景。

具体而言,Grok Imagine展现了三大核心「杀手锏」:

视频生成与指令遵循能力

Grok Imagine的视频生成能力,主要用来从零开始创建短视频(通常10-15秒长,支持480p或720p分辨率)。

它能处理多种输入方式,比如直接用文字描述场景、动作、灯光和心情来生成视频,或者上传一张静态图片,让AI给它「加戏」变成动态视频。

在视频生成方面,Grok Imagine拥有业界领先的指令遵循能力。你给出的指令再复杂,它也能精准理解并执行。

零门槛的视频编辑能力

视频编辑功能更像是给现有视频「动手术」,Grok Imagine可以让你能轻松修改内容,而不用专业软件。

它支持重新设计场景(比如换背景或风格)、添加或删除物体(例如加个道具或去掉多余元素)、控制动作(调整运动轨迹、速度或相机角度)。

操作起来简单:上传视频文件或URL,然后描述你想改啥,比如「把这个视频里的车换成飞船,加点爆炸效果」。

AI就会根据你的指令生成编辑后的版本,还保持原视频的核心元素。

视频编辑适合电影剪辑、广告调整或内容优化,编辑后视频还能带原生音频。

更快速度与更低成本的平衡

在性能表现方面,不仅要变强,还要变快。

因为如果生成速度太慢、价格太贵,大家根本不敢放开手脚去尝试。

因此xAI团队专门针对延迟、并发量和成本进行了极限优化。

这让Grok Imagine不仅跑得快,而且用起来更省钱。

它强调高质量、成本和延迟的平衡,支持端到端的创意工作流,包括视频生成、编辑和音频同步。

评测霸榜,力压谷歌

在基准测试中,Grok Imagine在图像转视频领域表现出色,尤其在用户偏好投票和性价比上。

在Image-to-Video Arena(arena.ai)排行榜上,Grok-image-video-720p以1404分位居第一(基于46.5万投票,34个模型),领先Google Veo-3.1-audio-1080p(1402分)。


https://arena.ai/zh/leaderboard/image-to-video

这是一个基于用户盲测投票的平台,使用Elo评分系统。评测强调真实世界视频质量和保真度,而非自动化指标。

在另一个独立排行榜Artificial Analysis Image to Video Leaderboard上,Grok以1337 ELO分领先,评估标准包括质量、生成速度和价格。

Grok-image-video在风格、主题和格式一致性上得分高,它的API定价约$4.20/分钟,低于谷歌Veo 3.1 Fast等竞品。


https://artificialanalysis.ai/video/leaderboard/image-to-video

在一些第三方的专业评测中,Getimg.ai认为Grok Imagine最突出的特点是以视频形式精准遵循指令,当提示词描述动作、节奏或转场时,该模型通常能做出看似经过深思熟虑而非偶然的回应。

比如,Grok-image-video在原生音频(唇同步、自然对话)和电影指令遵循(如平移、变焦)上出色。

Grok-image-video的另一个特色,是它很好地解决了低延时这一用户使用痛点。

AI视频模型在使用场景中,仅靠原始质量已不再足够,往往需要多轮交互,等待结果的时间过长会抑制用户尝试的意愿,尤其是当每次生成都代价高昂时。

基准测试显示,Grok Imagine在综合考量质量、延迟和成本时表现出色。

这意味着你可以自由地生成、调整和重新生成视频,而不会觉得每次输入提示都是一种负担。

Lovera Digital将Grok与Google Veo 3比较,发现Grok易用性高,适合短视频社交内容,但视频质量有时抖动。

它的最佳用例是快速原型,评分表显示其在创意短片上竞争力强。

Grok Imagine在第三方评测中被视为高效、音频强的选手,尤其适合创意和快速生成,但需注意一致性和安全问题。

如果你想亲自体验一下Grok Imagine,目前可以通过正式(grok.com/imagine)和APP免费试用,或通过API集成(Grok Imagine API)。

参考资料:

https://x.com/elonmusk/status/2026330684630130739%20

https://x.com/teslaownersSV/status/2026322222206648339

https://arena.ai/zh/leaderboard/image-to-video

来源:https://www.163.com/dy/article/KMKAICR40511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

小米大模型最新成绩:单周Token消耗量突破4万亿
科技数码
小米大模型最新成绩:单周Token消耗量突破4万亿

3月31日消息,小米技术最新公布MiMo-V2-Pro最新成果:该模型在OpenRouter平台近一周Token消耗量突破4万亿,拿下日榜、周榜、月榜三项第一。并且在真实人类盲测的TextArena

热心网友
03.31
Grok视频模型屠榜Arena,46.5万次盲测击败谷歌实力派
AI
Grok视频模型屠榜Arena,46.5万次盲测击败谷歌实力派

新智元报道编辑:元宇【新智元导读】马斯克亲自站台,grok-image-video-720p在46万次盲测投票中加冕第一,这款xAI「压箱底」的视频模型,不仅在基准测试上超过了谷歌Veo 3 1 F

热心网友
02.25
马斯克Grok 4.1发布:AI榜单大洗牌,盲测排名登顶
业界动态
马斯克Grok 4.1发布:AI榜单大洗牌,盲测排名登顶

就在OpenAI发布GPT-5 1,大谈“情商”之际,埃隆·马斯克(Elon Musk)也带着他的xAI,火速加入了这场“AI体验”之战。就在刚刚,xAI宣布推出Grok 4 1,这是对现有Grok

热心网友
12.02
罗永浩评麦景图音响:音质品控做工全翻车,奢华品牌也割韭菜?
科技数码
罗永浩评麦景图音响:音质品控做工全翻车,奢华品牌也割韭菜?

12月2日消息,罗永浩午间发微博谈到豪华音响品牌话题时表示:麦景图,这是我这辈子见过最坑人的豪华音响品牌,绝大多数机型音质垃圾,品控垃圾,做工垃圾,就那个复古的玻璃蓝色仪表盘还挺好看的,结果还特别容

热心网友
12.02

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

如何利用“清算热力图”预判大盘变盘点?实战操作指南
web3.0
如何利用“清算热力图”预判大盘变盘点?实战操作指南

清算热力图实战指南:精准预判加密市场变盘点的五大核心步骤 在波动剧烈的加密货币合约市场中,清算热力图正成为专业交易者洞察市场潜在“火药桶”的关键可视化工具。它通过动态展示不同价格区间的潜在清算头寸密度,将多空杠杆博弈的脆弱地带清晰呈现。掌握其核心用法,能有效辅助交易者识别价格可能发生剧烈转向或加速突

热心网友
04.17
不做成新罐头RPG!曝《刺客信条4:黑旗 重制版》坚守经典玩法
游戏评测
不做成新罐头RPG!曝《刺客信条4:黑旗 重制版》坚守经典玩法

《刺客信条:黑旗 Resynced》2026年发售,经典海盗传奇完全重制回归 据知名游戏爆料人Tom Henderson最新透露,备受玩家期待的《刺客信条:黑旗 Resynced》已正式定档,将于2026年7月9日全球同步发售。需要明确的是,本次项目并非简单的高清复刻版,而是对爱德华·肯威经典加勒比

热心网友
04.17
币安Binance现货合约交易官网入口 币安安卓苹果App下载注册与认证指南
web3.0
币安Binance现货合约交易官网入口 币安安卓苹果App下载注册与认证指南

币安Binance现货合约交易官网入口、App下载、注册与认证全指南 对于想要进入加密货币交易世界的新手来说,找到正确的起点至关重要。本文将为你清晰指引币安(Binance)的官方入口,并手把手带你完成从下载App、注册账户到完成身份认证的全过程。所有步骤都基于官方渠道,确保你的每一步操作都安全、可

热心网友
04.17
洛克王国世界前期哪个神宠比较好
游戏攻略
洛克王国世界前期哪个神宠比较好

洛克王国新手开局必看:前期神宠选择攻略与重要性解析 对于刚刚踏入洛克王国的新手玩家来说,开局阶段选择一只强力的前期神宠,是决定冒险旅程是否顺畅的关键。一只优秀的前期宠物不仅能让你轻松应对主线任务和日常挑战,更能帮助你快速理解游戏的核心战斗机制与属性克制关系。那么,在洛克王国前期,哪些宠物值得优先培养

热心网友
04.17
币圈合约中的“强平引擎”是如何运作的?保险基金起到什么作用?
web3.0
币圈合约中的“强平引擎”是如何运作的?保险基金起到什么作用?

深度解析:Web3合约交易中的强平引擎与保险基金核心机制 在波澜云诡的加密货币合约交易市场中,“强制平仓”是每一位交易者都极力避免却又必须深刻理解的风险事件。这背后并非一个简单的风控开关,而是一套被称为“强平引擎”的复杂、自动化、多层级风险管理系统。它的高效运作,直接关系到交易平台的稳健性与用户的资

热心网友
04.17