商汤发布日日新U1模型实现理解与生成统一

时间：2026-05-18 09:31

4月29日，商汤科技正式宣布开源其SenseNova U1系列原生理解生成统一模型。该系列模型的核心突破，在于其背后名为NEO-unify的自主研发架构。与当前主流的模块化拼接方案不同，NEO-unify架构实现了一次从“拼接”到“原生”的根本性范式跨越，代表了多模态AI模型发展的新方向。具体而言

4月29日，商汤科技正式宣布开源其SenseNova U1系列原生理解生成统一模型。该系列模型的核心突破，在于其背后名为NEO-unify的自主研发架构。与当前主流的模块化拼接方案不同，NEO-unify架构实现了一次从“拼接”到“原生”的根本性范式跨越，代表了多模态AI模型发展的新方向。

具体而言，NEO-unify架构做出了一项关键性取舍：它彻底摒弃了常见的视觉编码器（VE）和变分自编码器（VAE）等模块化设计思路。取而代之的，是重新构建了一个深度融合的统一表征空间，并将这种统一性深度贯彻到模型的每一层神经网络计算之中。这意味着，文本语言和视觉图像信息不再是被分别处理后再进行后期“对齐”，而是从模型训练的最初阶段，就被当作一个不可分割的复合整体来进行直接建模与学习。

那么，这种原生统一的多模态架构设计，究竟带来了哪些显著优势？最直接的效果是实现了语言与视觉信息的高效协同与深度融合。模型的理解能力与生成能力得以同步、均衡地增强，使其在保留丰富语义细节和上下文逻辑的同时，还能维持出色的像素级视觉保真度。简而言之，它既能精准“理解”图像中的复杂场景与物体关系，也能根据文本描述“生成”高度符合逻辑且细节精细的图像内容。

在需要深度逻辑推理、空间关系认知与视觉问答等复杂任务上，这种统一架构的优势表现得尤为突出。它能够赋能模型更深刻、更本质地理解物理世界的复杂空间布局、物体属性及它们之间的精细关联。展望未来，此类技术有望为智能机器人、自动驾驶等领域提供一个强大的“具身智能大脑”，使得从环境感知、情境理解、逻辑推演到最终决策执行的整个智能闭环，都能在单一、统一的模型内高效、流畅地完成。这无疑为后续的通用人工智能（AGI）技术演进与广泛的产业应用落地，奠定了一个坚实而关键的基础，并提供了强大的创新驱动引擎。

来源：https://www.donews.com/news/detail/1/6535193.html

商汤科技

上一篇长城汽车发布GF高性能架构打造首款国产GT3赛车 下一篇微信朋友圈排版调整官方客服回应来了

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略，采用“1+N+X”布局，联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm，体重69kg，移动速度0 8m s，具备40个自由度，续航超2小时。预计明年一季度发布首款车载组件机器人，已在广州车展展示。

业界动态 · 2026-06-29

中国信科刷新光通信世界纪录每秒可下载1.4万部4K电影

3月25日，光通信领域迎来又一个里程碑：中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司，成功实现了2 5Pb s 24芯光纤超大容量实时光传输，再次刷新了世界纪录。这一研究成果不仅入选国际顶级光通信会议OFC（2026）并荣获“高分论文”称号，还受国际权威SCI

业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查，焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿，不意味着立即召回，但可能引发后续监管措施。

业界动态 · 2026-06-29

doc个人图书馆停服创始人称无偿转让失败

运营长达20年，累计服务8000万用户的360doc个人图书馆，最终还是迎来了谢幕时刻。2026年5月1日，这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失，而是始终未能寻得一位能够安全接管的合适人选。创始人蔡智在告别信中坦言，近两个月来，他一直在尝试将360doc无偿转

业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月，艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证，紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后，折射出一个清晰的市场趋势：移动办公、户外出行、宿舍上网等场景的需求正在快速增长，随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿