首页 游戏 软件 资讯 排行榜 专题
首页
AI
国产视频生成团队开源三连,意外停摆的Sora后何去何从?

国产视频生成团队开源三连,意外停摆的Sora后何去何从?

热心网友
48
转载
2026-03-26



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

机器之心发布

就在昨天,全球 AI 视频生成领域迎来了一场 “超级地震”——OpenAI 竟然意外叫停了万众瞩目的 Sora 2 项目。



然而,就在行业巨头调整研发节奏的同一周,开源社区迎来了一波扎实的技术推进。一家位于北京的 AI 初创公司,在 GitHub 上连续三天释出了其核心技术栈 ——依次开源了 150 亿参数的 “演绎级” 音视频同出大模型、重新定义算力上限的分布式 Attention 组件,以及旨在突破显存瓶颈的全局编译框架

这家持续向开发者社区贡献底层技术的公司,正是Sand.ai。今天,我们就来深度拆解这家公司的技术脉络,看看这支中国团队是如何在当前的行业转折期中,走出一条独立的视频生成技术路线。



连续三天开源:一场自顶向下的技术拆解

第一天:演绎级音视频基座daVinci-MagiHuman

针对当前 AI 视频 “表演僵硬” 与 “音画不同步” 的痛点,Sand.ai 联合上海创智学院(SII)GAIR 实验室,开源了 150 亿参数的音视频同出大模型。该模型采用单流 Transformer 架构,将文本、视频与音频进行统一联合建模,彻底告别了复杂的跨注意力分支。



视频链接:https://mp.weixin.qq.com/s/o_McSh2rXjB1btMhCO6fQg

第二天:分布式 Attention 组件MagiAttention v1.1.0

为了支撑超大模型的训练与极速生成,团队发布了深度适配 Hopper 与 Blackwell 架构的算力组件。它通过构建原生的 Group Collective 通信内核(以 NVLink 替代冗余的 RDMA 传输)来大幅降低跨机通信量,并引入 Dispatch Solver 实现全局负载均衡。



第三天:训推一体全局编译框架MagiCompiler

针对大模型开发中 “速度与显存难以兼得” 的技术矛盾,Sand.ai 释出了基于 torch.compile 深度优化的即插即用编译框架。它通过整图 / 整层编译、启发式自动重计算以及 JIT Offload 调度,全面接管了计算调度与显存生命周期。实测显示,在推理端甚至能让 RTX 5090 以近乎实时的速度运行超大视频模型。



团队介绍:“少数派” 的技术信仰

Sand.ai 成立于 2024 年,创始人是曹越博士。熟悉计算机视觉(CV)发展史的朋友对他绝对不陌生:在微软亚洲研究院(MSRA)期间,曹越作为核心作者发表的《Swin Transformer》一举拿下了 ICCV 最佳论文奖(马尔奖),目前其 Google Scholar 引用量已逼近 6 万次。联合创始人张拯同样是该论文的核心作者。



这是一支具有极强科研与工程背景的团队。成立不久,Sand.ai 便完成了由源码、今日、经纬等领投的多轮融资。有了充足的资金支持,Sand.ai 并没有选择直接跟随行业主流的 Sora 路线。当大部分团队都在追捧 DiT(Diffusion Transformer)架构时,他们坚信:通过自回归(Autoregressive)预测视频块序列来生成视频的世界模型,才是更接近物理世界第一性原理、且具备更强 Scaling 能力的终局。据悉,近期 Sand.ai 又快速完成了一轮数千万美金融资。

目前,Sand.ai 旗下主要布局了两款核心模型,分别针对影像创作周期中的不同核心诉求:

Magi-1:近期,实时生成的 “自回归世界模型” 正成为全行业追捧的热门方向,但 Sand.ai 早在近一年前,便发布了全球首个自回归视频生成大模型 Magi-1。它彻底告别了传统 AI 视频的 “慢动作” 与死板感,实现了极具爆发力的流畅动作、无限长度续写,以及精细到 1 秒的时间控制。



GAGA-1:国内首个推出的音画同出生成模型,主打 “AI 演员” 级别的极致表现力。解决了行业内最头痛的 “人物不一致” 和 “表情太假” 问题,在物理规则连贯性和原生音画同步上屡破纪录。



在深耕底层架构与开源基建的同时,Sand.ai 展现出的另一层核心壁垒,是其将前沿技术转化为实际应用的产品化能力。

据了解,Sand.ai 中较为低调的小团队还推出了一款 Video Agent,主要面向海外市场。据市场反馈,该产品目前在海外大受好评,主要体现在一键直出视频创作流程的智能化水平方面,海外商业化增长势头强劲,值得行业持续关注。

结语:Advance AI to Benefit Everyone

当 Sora 2 按下暂停键,AI 视频的故事并没有结束。Sand.ai 连续三天的开源不仅展示了其在模型、算力和编译框架上的全栈技术实力,更向我们展示了一家顶级 AI 公司应有的姿态:既有仰望星空的技术信仰,又有脚踏实地的底层死磕,更有拥抱世界、造福开发者的开源胸怀

正如 Sand.ai 致力于将前沿技术转化为触手可及的生产力工具,将 “AI 演员” 和 “通用视频生成” 变为现实。这种对底层的坚守与对应用的探索,正是实现 “Advance AI to Benefit Everyone” 这一宏大愿景的必经之路。

技术的突破从来不是一蹴而就的。在这条布满荆棘但充满希望的道路上,我们有理由相信,像 Sand.ai 这样拥有清晰技术信仰、兼具科研与工程能力的 “少数派” 团队,正悄然改变着视听生成的未来。我们也期待,有更多拥有相同信仰、渴望在 AI 浪潮中留下扎实脚印的人才,能与他们并肩前行,共同推动 AI 技术的普惠发展。

来源:https://www.163.com/dy/article/KOV0754I0511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国产视频生成团队开源三连,意外停摆的Sora后何去何从?
AI
国产视频生成团队开源三连,意外停摆的Sora后何去何从?

机器之心发布就在昨天,全球 AI 视频生成领域迎来了一场 “超级地震”——OpenAI 竟然意外叫停了万众瞩目的 Sora 2 项目。然而,就在行业巨头调整研发节奏的同一周,开源社区迎来了一波扎实的

热心网友
03.26
龙虾之父新访谈揭露OpenClaw内幕,呼吁玩家远离滥用隐患
AI
龙虾之父新访谈揭露OpenClaw内幕,呼吁玩家远离滥用隐患

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI不是,这才加入OpenAI几天啊,龙虾之父Peter Steinberger这波发言属实猛了些啊!在OpenAI的最新访谈中,他聊创业、聊OpenC

热心网友
02.25
开源Cowork爆火,Anthropic跟进推出社区版
AI
开源Cowork爆火,Anthropic跟进推出社区版

新智元报道编辑:艾伦【新智元导读】仅用两天开发出的开源项目 Openwork,如何逼迫 AI 巨头 Anthropic 低头?面对免费、更快、更安全的开源竞品,Anthropic 紧急将原本 $10

热心网友
01.18
IDEA源码解码器:10个技巧轻松提升代码阅读效率
科技数码
IDEA源码解码器:10个技巧轻松提升代码阅读效率

如果你想查看某个类中,比如某个方法的具体源码,当然,不可能给你展现在图形上了,不然屏幕还不得撑炸?但是可以利用图形,或者配合 IDEA 的 structure 方便快捷地进入某个类的源码进行查看。

热心网友
11.05

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

鲁大师软件管家使用教程:一键升级常用电脑软件
电脑教程
鲁大师软件管家使用教程:一键升级常用电脑软件

鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;

热心网友
03.29
北京推进智能网联新能源车险,支持L2-L4级别统一适配
科技数码
北京推进智能网联新能源车险,支持L2-L4级别统一适配

3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失

热心网友
03.29
苹果今年将发布两款新iPhone应用,包含聊天机器人
科技数码
苹果今年将发布两款新iPhone应用,包含聊天机器人

预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple

热心网友
03.29
苹果聘请前谷歌副总裁分管AI产品营销
科技数码
苹果聘请前谷歌副总裁分管AI产品营销

据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有

热心网友
03.29
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀
科技数码
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀

3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个

热心网友
03.29