游乐游手机版
首页/科技数码/文章详情

商汤科技联手南洋理工开源NEO架构:原生多模态模型新版发布

时间:2025-12-03 11:29
商汤科技与南洋理工大学S-Lab联合宣布,正式推出并开源全新多模态架构NEO,为日日新SenseNova多模态模型提供新一代技术支撑。这一突破性架构通过底层创新实现视觉与语言的深度融合,在性能、效率

商汤科技与南洋理工大学S-Lab联合发布新一代多模态架构NEO,该架构现已正式开源,为日日新SenseNova多模态模型提供了全新的技术底座。这一突破性架构通过底层创新实现了视觉与语言的深度交融,在性能、效率及通用性方面均有显著提升,标志着多模态技术从“模块化拼接”向“原生融合”的范式转变。

传统多模态模型多采用“视觉编码器+投影器+语言模型”的模块化设计,以语言模型为核心扩展图像处理能力。然而,这种架构本质上仍以文本为主导,图像与语言的融合仅停留在数据层面,导致模型在复杂场景中(如精细图像分析或空间结构理解)表现受限。商汤科技指出,此类“拼凑式”设计不仅学习效率低下,更难以满足真实场景对多模态协同的需求。

针对上述痛点,NEO架构从底层机制重构多模态处理逻辑,通过三大核心创新实现原生融合:其一,原生图块嵌入技术摒弃离散图像分块方式,采用自底向上的连续映射技术,直接从像素生成语义词元,显著提升图像细节捕捉能力;其二,原生三维旋转位置编码解耦时空频率分配,为视觉与文本模态分配差异化频率参数,使模型同时具备图像空间结构解析与视频跨帧建模潜力;其三,原生多头注意力机制在统一框架下实现文本自回归注意力与视觉双向注意力的协同,强化空间关联推理能力。

在训练策略上,NEO采用Pre-Buffer与Post-LLM双阶段融合机制,既保留原始语言模型的完整推理能力,又从零构建视觉感知模块,有效解决跨模态训练中语言能力退化问题。测试数据显示,该架构仅需3.9亿图像文本样本(约为行业同等性能模型的十分之一),即可在视觉理解任务中比肩Qwen2-VL、InternVL3等旗舰模型。在MMMU、MMB等权威评测中,NEO架构多项指标位居前列,尤其在0.6B至8B参数规模的边缘部署场景中,展现出显著的成本与效率优势。

目前,商汤已开源基于NEO架构的2B与9B参数模型,开发者可通过开源社区获取技术文档与模型权重。此次开源不仅为学术界提供前沿研究基准,更为工业界部署高效多模态应用提供新选择。随着原生融合架构的普及,多模态技术有望在智能终端、自动驾驶、医疗影像等领域实现更广泛的应用突破。

来源:https://www.itbear.com.cn/html/2025-12/1037338.html
上一篇iRobot扫地机器人陷亏损:负债35亿,欠中国代工厂16亿 下一篇传音控股赴港提交H股上市申请 非洲手机市场巨头加速扩张
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态
科技数码 · 2026-07-01

国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态

6月30日,机器人ETF易方达(159530)盘中涨幅超过4 3%,报收1 555元,机器人板块整体表现活跃。消息面上,国内首个基于开源鸿蒙的机器人操作系统社区(M-Robots)正式启动运营并发布了年度发展路线,日本GMO INTERNET集团子公司与宇树科技达成合作协议。国产机器人软件生态建设取

ROI利剑悬顶,AI员工面临效益大考
科技数码 · 2026-07-01

ROI利剑悬顶,AI员工面临效益大考

先说说现在AI行业一个普遍现象:几乎所有公司都在按“使用量”来收费。不管是按token消耗算,还是按额度制走,本质上都是“用多少,付多少”。 这套模式放在模型API上当然没问题,但放到那些越来越深入企业工作流的Agent身上,就有点水土不服了。你想想,一个Agent为了完成一个任务,需要反复读取上下

武汉光谷三年投入超10亿元打造智能体之城
科技数码 · 2026-07-01

武汉光谷三年投入超10亿元打造智能体之城

6月29日,武汉光谷智能体经济大会正式召开,会上重磅发布了“光谷智能体引力计划”。根据规划,未来3年内,光谷将在政策扶持、算力基建、产业基金等领域投入超过10亿元,致力于全域打造智能体之城,抢占人工智能产业新高地。 具体如何推进?主要依托湖北科创供应链平台,设立光谷智能体场景发布厅,引导百亿级人工智

苹果印度梦受挫 iPhone 18 Pro机密文件泄露
科技数码 · 2026-07-01

苹果印度梦受挫 iPhone 18 Pro机密文件泄露

从暗网流出的文件来看,窃取苹果印度供应商塔塔电子数据的勒索软件组织,此次曝光的“重磅信息”中,明确包含了即将发布的iPhone 18 Pro机型的敏感组件清单、供应商名单以及实物照片。消息人士和文件内容均证实了这一点。 这绝非小事。苹果在全球供应商之间精密运转的iPhone组装业务,直接面临威胁。众

企业级AI聚焦全场景闭环办事加速成为业绩抓手
科技数码 · 2026-07-01

企业级AI聚焦全场景闭环办事加速成为业绩抓手

AI产业正从技术验证阶段迈向深度产业落地的关键转型期,这一趋势正成为驱动企业数智化增长的核心引擎。6月30日,联想乐享迎来重要升级——4 0版本正式发布。作为业界首个企业级超级智能体,此次升级带来了三项扎实成果:自主研制的Harness运行层、自我进化与反思机制,以及多场景Skill能力体系,三大支