首页 游戏 软件 资讯 排行榜 专题
首页
AI
魔芯科技获亿元融资 浙大00后团队世界模型产业落地

魔芯科技获亿元融资 浙大00后团队世界模型产业落地

热心网友
90
转载
2026-05-14

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

时间回到2021年,那时ChatGPT尚未问世,大语言模型远未破圈。“世界模型”这个概念也才刚露头角。Da vid Ha和Jürgen Schmidhuber那篇著名的《World Models》论文,还只是让AI在赛车游戏里“做梦”;李飞飞创办World Labs,则是三年后的事。整个领域距离商业化,看上去还很遥远。

就在这一年,还在浙江大学读本科的陈天润,做了一个在当时看来相当激进的决定:成立一家公司,专注做3D和AI。

他接触编程很早,高中就开始写代码。大学期间,他深度参与了大量3D建模与重建的研究,也产出了一些学术成果。创业的初衷很朴素:自己从事的是偏应用的学科,如果能通过商业化的方式,把那些等待落地的新技术推到更多人面前,值得一试。与此同时,他内心有一个关于市场的判断:更强的人工智能一定会出现,而那将带来巨大的机会。

后来的故事证明,这个判断不仅正确,而且验证的速度远超预期。

第三条路

要理解魔芯科技在做什么,得先搞清楚“世界模型”这个概念。

不妨用我们熟悉的大语言模型来类比。大模型的本质是预测下一个词:你输入一段上文,它帮你补出下文。给它小说的前半段,它能续写后半段,因为它“见过”类似的模式。世界模型干的是类似的事,只不过它预测的对象不是文字,而是三维空间中的物理状态。你给它一个当前的场景和某种变化条件,它能推演出下一刻这个世界会变成什么样。

从预测语言的下一个token,到预测世界的下一个状态——这被认为是2026年AI领域最重要的范式迁移之一。

放眼全球,这条赛道上最受关注的几股力量已然清晰。李飞飞的World Labs在2026年2月完成了10亿美元融资,其产品Marble已能从图片和文字生成高保真3D世界,走的是基于3D高斯的技术路线。杨立昆离开Meta后创办的AMI Labs,则探索更偏理论前沿的JEPA架构。此外,Google DeepMind也推出了实时交互世界模型Genie 3。

魔芯选择的,是一条与他们都不同的“第三条路”。

陈天润和团队采用了纯隐式的方法来实现世界模型的扩展。他们没有依赖3D高斯作为中间表示,也没有借助传统的显式几何重建,而是纯粹依靠数据驱动,通过规模来堆叠模型能力。这意味着,模型的表现更取决于数据的质量与数量,而非手工设计的先验规则。

图丨隐式结构路线与其他方案对比(来源:魔芯科技)

这条路线对数据的要求极高,而数据,恰恰是魔芯自2021年成立起就开始布局的核心资产。他们很早就雇佣设计师和美术艺术家制作三维内容,逐步积累了覆盖复杂物理场景、动态自然环境的PB级3D模型与场景资产。在AI领域,高质量的3D数据始终是稀缺资源,无法像文本和图片那样从互联网海量抓取,只能靠时间慢慢沉淀。

“我们不光有数据,还打磨了一套让人能画得更快的工具,”陈天润解释道,“这套工具本身也是壁垒。如果你相信世界模型是一个依赖数据规模效应的范式,那么谁能更快、更高效地产生数据,谁就握有优势。”

在具体的模型设计上,他们的KOKONI-World采用了14B的参数规模,比部分同行公开使用的1.5B模型大了近十倍。更大的网络意味着更强的信息承载能力,但推理速度和成本随之成为挑战。为此,团队设计了一套级联式知识蒸馏方案:目标不是把大模型压缩成小模型,而是将多步推理过程蒸馏为少步推理,在保持模型尺寸不变的前提下,大幅减少推理迭代次数。

另一个关键设计是相机感知记忆结构。KOKONI-World生成的场景背后,存储着完整的3D空间信息。当用户在场景中移动视角、探索不同位置后再回头看,场景的几何结构和视觉细节不会崩塌或矛盾。它不是在逐帧渲染画面,而是在构建一个具有空间一致性的场景记忆。

图丨KOKONI-World 4D场景生成效果 图左:RGB视频生成;图右:3D点云生成 (来源:魔芯科技)

这两项技术叠加,让KOKONI-World跑出了一组亮眼的数据:支持长达2000帧(约两分钟)的场景记忆与连续动态预测;能输出1080P全高清的实时交互画面;并提供6自由度的精确相机控制。

魔芯参与的一项前馈式4D基座模型研究,为这个技术选择提供了实验支撑。研究显示,当训练数据扩展到百万量级、模型参数超过10B时,重建误差会出现显著且持续的下降,模型开始展现出长时一致的空间建模能力。这条性能随规模增长的曲线,与大语言模型早期观察到的规律高度相似,这无疑证实了3D和4D场景建模同样遵循Scaling Law(规模定律)。

图|实验结果,随着数据量的增加(左图)和模型尺寸提升(右图),模型精度持续提高(误差降低)

年轻团队的牌面

打造出这套技术体系的,是一支平均年龄不到30岁的全博士团队。核心成员来自浙大、中科大、同济等高校,几位研发骨干从博士阶段就深耕多模态大模型驱动的3D重建与视频生成,在相关顶会上发表了数十篇论文。

陈天润将这种团队构成视为一种优势:“我们不是计算机视觉或自动驾驶领域的老兵转行来做这件事。我们是一群搞大模型的人,在直接做世界模型。”他认为,做基础模型就应该采用数据驱动的方式,而他们这批研究者对这种范式有着天然的信心和丰富的实操经验。

作为00后CEO,陈天润坦言在2021、2022年创业早期,确实遇到过因年龄而产生的质疑。但2023年之后,ChatGPT的成功让世界看到了一个事实:许多最前沿的AI创业公司,正是由一群非常年轻的从业者推动的。年轻、精干、没有历史包袱,在快速迭代的AI时代,反而成了一种独特的优势。“国际上很多创新就是这么发生的,”他补充道。

而这群年轻人,也确实拿出了不一样的东西。魔芯的模型具备一项区别于多数同行的能力:它既能输出人类可直观理解的显式结果,如视频、3D点云、3D高斯场景,也能输出纯隐式的token和向量。后者对于机器人、自动驾驶等下游应用更具价值,因为机器决策需要的往往不是一段渲染精美的视频,而是能直接用于路径规划或行为预测的空间表征。这种“两头都能交付”的灵活性,让魔芯在面对不同类型的产业客户时游刃有余。

基于这种能力,魔芯成为了世界模型赛道上少数已经实现收入的团队。他们在2025年就交付了第一版模型,其3D重建服务已对外售卖,支持API调用和定制化开发。在影视娱乐、数字孪生、自动驾驶、具身智能等多个方向,他们已与产业方展开实际的项目对接与交付。部分积累的PB级3D数据资产,也以开放合作的方式提供给其他AI研究团队使用。

从 BERT 到 ChatGPT

进入2026年,魔芯科技的节奏明显加快了。

公司近期完成了由浙创投等国资机构及多家产业资本投资的Pre-A++轮融资,新一轮A轮融资也即将落地。陈天润在有意识地引入产业资本而非纯财务投资人。“行业还处于非常早期的阶段,需要生态伙伴一起共建,这不是一家公司能独立搞定所有事情的时候。”

另一个关键节点是下一代模型的发布。魔芯即将推出参数规模约为现有版本两倍的新模型,核心改进在于支持更高的输入分辨率。此前,用户只能输入分辨率较低的图片,模型能重建的信息细节有限。新版本将能处理更大尺寸的图像输入,从而捕捉和重建更丰富的场景细节。陈天润表示,这个版本在3D建模的准确度和泛化能力上,预计将超越目前市面上的同类模型,并会同步对外开放服务和发表学术论文。

当然,陈天润对当前阶段有着清醒的认识。世界模型作为一个新兴范式,整个行业都还处于能力爬坡期,模型的泛化性和场景覆盖度仍在持续迭代中。他将现阶段比作大语言模型在ChatGPT诞生前的“BERT时代”:基础能力已经涌现,但距离真正引爆市场的产品化爆发,可能还需要一到两年的深耕与打磨。从BERT到ChatGPT,中间经历了GPT-2、GPT-3、GPT-3.5的数代演进,世界模型的演化大概率也需要一个类似的过程。

被问及五年后希望外界如何评价魔芯科技时,陈天润给出了一个明确的答案:“3D的ChatGPT时刻。”

这个目标不可谓不大。ChatGPT之所以成为里程碑,不仅仅因为其模型能力强大,更在于它让普通人第一次直观地感受到了AI的潜力与魅力。所谓的“3D的ChatGPT时刻”,意味着世界模型将不再是实验室论文里的抽象概念,而是真正部署到数以亿计的设备中,让AI能够理解并可靠交互于物理世界的基础能力。陈天润估算,这个方向最终面向的是一个万亿级别的广阔市场。

不过,眼下最紧迫的事情,还是把新一代模型扎实地交付出去。“我们希望做真正能work、能落地的东西,”陈天润强调,“而不仅仅是发布在公众号上的新闻。”

来源:https://www.aitntnews.com/newDetail.html?newId=25050
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

2026技术路线辨析世界模型与VLA融合进化是AI发展关键
业界动态
2026技术路线辨析世界模型与VLA融合进化是AI发展关键

2026年春天,具身智能领域掀起了一场关于技术路线的激烈辩论。一方观点认为“VLA时代已经终结”,世界模型才是未来;另一方则坚信VLA依然是主航道。争论的核心直指一个根本问题:当机器人需要在真实物理世界中执行任务时,它的“大脑”究竟应该如何设计? 2026年4月23日,智平方创始人郭彦东博士在Fai

热心网友
05.14
中科院首创星际争霸AI世界模型赋予游戏智能体预知能力
AI
中科院首创星际争霸AI世界模型赋予游戏智能体预知能力

在电子竞技领域,能否提前预判未来几秒的战局,将直接决定胜负的天平?这看似科幻的场景,如今已被中国科学院复杂系统认知与决策智能重点实验室的科研团队变为现实。他们成功研发出首个专为《星际争霸II》定制的人工智能世界模型——StarWM,使游戏AI首次获得了“预演未来”的决策能力。这项里程碑式的研究成果已

热心网友
05.12
南开大学首创千帧交互式世界模型实现实时动态模拟
AI
南开大学首创千帧交互式世界模型实现实时动态模拟

想象一下,通过键盘控制,在虚拟世界中自由探索超过1000帧的连续画面,而整个世界始终保持惊人的一致性和真实感,仿佛真正置身于一个活生生的环境。这听起来像科幻情节,但南开大学联合美团团队的最新研究成果“Infinite-World”,已将其变为现实。 这项发表于2026年2月(论文编号arXiv:26

热心网友
05.12
手机端灵光上线体验世界模型功能探索智能新边界
业界动态
手机端灵光上线体验世界模型功能探索智能新边界

一张随手拍摄的照片,一部随身携带的手机,你就能即刻踏入由AI实时构建的立体世界。这不再是科幻电影的专属情节,而是如今触手可及的现实体验。 4月27日,蚂蚁灵光App正式推出“体验世界模型”功能,成为业内首个让普通用户在移动端亲手操作、沉浸式体验世界模型的AGI产品。其操作便捷性令人惊叹:仅需上传一张

热心网友
05.12
实测世界模型Happy Oyster一分钟体验究竟是奇迹还是幻觉
业界动态
实测世界模型Happy Oyster一分钟体验究竟是奇迹还是幻觉

阿里发布开放式世界模型HappyOyster,支持多模态输入与实时交互,能根据指令生成动态画面。该模型被视为AI理解物理世界的关键一步,展现出语义生成潜力,可辅助游戏视觉设计,但目前存在一致性问题,更接近可交互视频系统,难以替代传统引擎。未来或将从改造开发流程入手赋能游戏行业。

热心网友
05.11

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

恋与深空温泉剧情引争议 官方回应玩家举报并处理
游戏资讯
恋与深空温泉剧情引争议 官方回应玩家举报并处理

《恋与深空》温泉剧情推广视频因男主角半裸、女主角抚摸互动及喘息音效,被质疑内容露骨擦边。玩家意见分化,部分认为超出浪漫氛围,部分视为常见亲密刻画。官方已回应并处理举报。该游戏此前也曾因尺度问题引发讨论,此次争议再次引发对女性向恋爱游戏内容边界的探讨。

热心网友
05.14
烹饪牌局公测时间公布 何时上线正式揭晓
游戏资讯
烹饪牌局公测时间公布 何时上线正式揭晓

玩家可通过关注游戏官方渠道获取《烹饪牌局》公测信息,或利用游戏社区APP的订阅功能接收推送通知。此外,查询正规手游开测时间表也能了解测试计划。结合这些方法,可及时掌握游戏公测动态。

热心网友
05.14
短线炒币盈利多少卖出 止盈策略与技巧详解
web3.0
短线炒币盈利多少卖出 止盈策略与技巧详解

短线交易盈利5%到30%区间分批抛出较为合理。主流币目标常为5%-15%,小币种或高波动行情可放宽至20%-30%。需结合市场动态调整:震荡市5%-8%可止盈,牛市可设20%-30%目标并配合移动止盈,熊市反弹则3%-5%应果断卖出。可运用分批止盈技巧平衡风险与收益,并严格执行纪律,确保止盈止损相匹配。

热心网友
05.14
索尼重申PS新作不会首日加入订阅服务
游戏资讯
索尼重申PS新作不会首日加入订阅服务

索尼重申其PSPlus服务不会大规模采用新作首日入库模式,与XboxGamePass策略形成对比。其会员服务分层明确:基础档提供经典老游戏,进阶档主打历史游戏库,高级档侧重云游戏和复古体验。官方表示每年仅精选少数独立游戏首日入库,所有入库内容均经严格筛选,并借此平台为优质独立游戏提供曝光机会。

热心网友
05.14
索尼解释30%平台抽成原因:为支持万名开发者持续投入
游戏资讯
索尼解释30%平台抽成原因:为支持万名开发者持续投入

索尼解释PlayStation商店30%抽成是维系开发者生态的“关键投入”,超万名开发者参与其中。该抽成支撑着平台运营体系,但索尼因此面临反垄断诉讼,被指控滥用市场地位。目前PS5数字版游戏销量占比已达85%,玩家对商店依赖度显著上升。

热心网友
05.14