凭借国内第一的实力,商汤日日新 V6.5 一举拿下了2025年多模态大模型收官之战的胜利!
12月29日,权威大模型评测基准 SuperCLUE 正式发布了《中文多模态视觉语言模型测评基准12月报告》。报告显示,商汤日日新 V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内榜首,斩获金牌,并在视觉推理维度上取得了国内最高分。

此次评测覆盖了基础认知、视觉推理与视觉应用三大维度,总计二十项细分任务。测评结果表明,商汤 SenseNova V6.5 Pro 最新版以75.35分拿下国内模型第一,领先于豆包-seed-1.6-vision、ERNIE-5.0、通义千问-Qwen3 等强劲对手。同时,以商汤日日新为代表的国产模型,正在大幅拉近与国外头部模型的差距,全球竞争力得到显著提升。

在各维度能力对比中,报告指出,商汤日日新 V6.5 等国产模型在基础认知维度方面已接近头部平均水平,部分任务甚至看齐 Gemini 3.0 Pro。而在视觉推理维度上,国产模型中仅有商汤日日新 V6.5 超过了头部平均水平,处于行业领先地位,其余国产模型仍有明显差距。
具体而言,商汤日日新 V6.5 共在七个细分任务中取得国内第一。其中,物体描述、文本识别、环境辨识、逻辑推理、代码设计、自动驾驶领域六大细分任务并列国内第一,科学推理任务斩获79.17分为国内最高。
此外,在表情识别、3D 物体识别、数学推理、工业应用能力、医疗影像分析、图形界面理解、内容审核等细分任务中,商汤日日新 V6.5 也有优异表现,综合位居国内模型第一梯队,展现出全面的多模态认知、推理和应用能力。
坚持底层创新,以用户价值牵引模型迭代
商汤能在多模态领域实现突破,得益于其始终坚持“多模态通用智能”技术战略,以底层创新突破产业发展瓶颈。从创新的模型架构,到打通数据壁垒,再到训练范式的革新,商汤日日新大模型不断拓展多模态大模型的能力边界。
今年,商汤还发布并开源了 NEO 多模态架构,重构了视觉与语言的融合机制,实现了内生的多模态能力,仅用1/10的数据就达到了同量级多模态模型的最佳水平;同时,通过结合多模态数据整合与超越 Next Token Prediction 的突破性跨视角预测(Cross-View Prediction)训练范式,商汤日日新在空间智能表现上超过了 GPT-5、最新的 Gemini-3 Pro,以及 Cambrian-S。另外,商汤还基于算法、系统、模型、架构多层面的联合创新,实现了成本与效率的双重突破。
本月“商汤产品发布周”上,商汤发布了多个基于日日新大模型的 AI 应用与产品,为视频创作、AI 办公、电商直播、具身智能以及人们的日常生活等,带来效率提升与智能化体验升级,让 AI 实现从“生产力工具”向“生产力”本身的跃迁。
