时间:2025-09-02 作者:游乐小编
当前AIGC技术正从文本、图像领域向更复杂的3D空间与视频创作领域扩展,然而现有的生成模型普遍面临两大核心难题:首先是对物理世界空间结构的认知局限,导致生成的3D场景缺乏必要的逻辑性;其次是视频创作过程中因视角转换带来的时间与空间一致性挑战。
"人工智能何时才能从虚拟世界迈入实体世界?我们坚信空间智能将在这项跨越中扮演关键角色。"群核科技联合创始人兼董事长黄晓煌表示。
对于空间智能的发展而言,其核心在于让AI系统真正掌握物理世界的"语言":实现AI用空间语言来描述世界,这是实现人机交互的最关键一步。
近期,被誉为杭州"六小龙"之一的群核科技正式宣布开源空间语言模型SpatialLM 1.5与空间生成模型SpatialGen。这标志着中国企业首次面向全球开发者开放专注于3D室内场景认知与生成的大模型系统。
此次发布的双模型分别针对行业两大痛点:SpatialLM 1.5采用"空间语言"实现3D场景的结构化生成与交互;SpatialGen则运用3D高斯技术确保多视角图像的空间连续性。
前者生成具备物理正确性结构化信息的场景,支持用户通过SpatialLM-Chat对话系统进行端到端的场景构建;后者专注"场景呈现",可根据文字说明、参考图像和3D空间布局,输出时空一致的多角度画面。
传统多模态模型通过图像切割方式实现跨模态理解,但本质上仍是2D信息处理。SpatialLM 1.5的创新之处在于将空间关系编码为"语言",通过通义千问3小模型训练,实现基于空间指令的3D场景端到端生成。
3D数据的稀缺性成为制约空间智能发展的瓶颈。群核科技通过旗下的酷家乐平台积累了海量3D设计数据,截至2025年6月30日,公司已拥有超过4.41亿个3D模型及5亿多个结构化3D空间场景。
当前市场上主流的AI视频工具常常出现物体变形、背景混乱等问题。群核科技研发的SpatialGen采用3D高斯场景作为中间载体,实现真正意义上的多视角连贯图像生成。
群核科技持续推动开源战略,近期开源的3D高斯数据集InteriorGS在Hugging Face平台登上榜首。公司表示,这不仅是技术突破,更是一种生态建设策略。
通过空间智能大模型体系,中国企业有望突破传统工业软件的"卡脖子"问题,在AI原生设计工具领域实现弯道超车。
2021-11-05 11:52
手游攻略2021-11-19 18:38
手游攻略2021-10-31 23:18
手游攻略2022-06-03 14:46
游戏资讯2025-06-28 12:37
单机攻略