商汤徐立谈AI规模化爆发:语言与视觉融合是突破智能上限路径
“语言与视觉的深度融合是突破智能上限的高效路径。”
3月24日晚间,在人工智能公司商汤集团股份有限公司(商汤-W,0020.HK)业绩会上,商汤科技董事长兼CEO徐立表示:“我们深信语言与视觉的深度融合是突破智能上限的高效路径。我们基于NEO原生架构,高效实现理解与生成统一,探寻多模态的新‘尺度定律’。这一系列技术突破和智能体AI的深度结合将打开新的应用可能性,赋能全新垂直场景。”

当天,商汤科技发布了全年业绩公告。2025年总收入50.15亿元,同比增长32.9%,创历史新高,增速为近三年最快;净亏损17.82亿元,大幅收窄58.6%;经调净亏损19.56亿元,同比收窄54.3%;下半年息税折旧摊销前利润(EBITDA)3.8亿元,为上市后首次转正。
按业务来看,生成式AI业务收入36.29亿元,同比大幅增长50.98%;视觉AI业务收入10.83亿元,保持平稳;X创新业务收入3.02亿元,同比减少5.92%。
商汤表示,生成式AI业务收入大增主要是由于市场需求持续爆发性增长,以及一体化产业解决方案促进了计算平台、模型及应用的联合商业化;而X创新业务的减少主要归因于智能驾驶业务脱离综合财务报表,随着时间的推移,预期X创新业务的构成会发生演变,未来该特定收入的同比数据比较意义将降低。
商汤科技联合创始人、执行董事、首席科学家林达华也表示,随着春节后OpenClaw的“走红”,带来了Token(词元)消费的显著增长,整个行业也走向了Agentic AI(智能体AI)时代。
林达华指出,纯语言数据已经见顶,语言和视觉的深度融合,将会成为突破AI智力上限的关键路径。在软件AI时代,很多复杂业务场景都会涉及多模态信息综合处理。将智能体的视觉能力和语言处理深度连接,可以显著提升复杂任务的成功率和效率,并且大幅度降低token消耗。商汤此前推出的NEO架构打破了传统拼接架构,进行了底层的多模态原生改造,提升了学习和推理效率,用1/10的数据量就能达到SOTA(最先进,State-Of-The-Art)性能。
据透露,商汤将在今年第二季度发布新版NEO架构,效率还将再提升2-3倍。

商汤科技联合创始人、大装置事业群总裁杨帆也表示,现在上千P(PetaFlops,1P相当于每秒1000万亿次计算速度)甚至几千P的单一集群客户越来越多,商汤的整体算力规模已经达到4.04万P,其中国产算力超过5500P,规模越来越大。
杨帆表示,商汤会利用技术积累,与国产厂商一起不断进行软硬件联合优化,提升性价比,拓展可适用模型范围,让越来越多的公司接受并拥抱国产体系。

对于未来发展规划,徐立表示:“展望2026年,我们看到AI真正迎来了规模化的爆发阶段。商汤也已经做好了准备,接下来的发力点也比较清晰和明确。”
徐立表示,首先要坚持原生多模态的路径,通过技术落高定义AI的新范式和智能的新高度,确立在AI前沿领域的领先地位;其次要深耕产业智能化,打造Agent原生时代的入口,“我们相信AI会从辅助工具进化为真正的生产力,在泛办公、教育、营销、智能终端等这些垂直赛道,我们要抢占入口,实现流量和商业价值的双向爆发”;第三,要把单位智能成本压到极致,依托算力、模型、应用协同要持续降低推理成本,全力推动国产算力从可用走向好用;第四,视觉AI要跑出规模化红利,握紧CV(计算机视觉,Computer Vision)2.0时代的盈利密码,推动业务的规模化扩张和规模化利润;同时,还要坚持海内外双引擎发力,把商汤方案做到AI产业标杆。
徐立最后还指出,要持续兑现“1+X”的生态红利,进一步优化“母舰+子舰”的协同模式,和生态伙伴一起抓住垂直行业爆发带来的增值红利。
3月25日,商汤股价盘中最高涨幅5.76%,达2.02港元/股,截至收盘跌1.57%,报收1.88港元/股。
此外,澎湃新闻还获悉,在即将召开的2026全球开发者先锋大会上,商汤科技将带来基于多模态大模型的智能应用商汤输入法AudioClaw以及AI语音开放平台SenseAudio两项AI语音技术成果。
相关攻略
新加坡国立大学团队提出TGO方法,无需依赖成对偏好数据,可直接利用单个样本的标量评分优化视觉生成模型。该方法通过估计分数阈值划分伪正负例,并依分数距离加权训练,在图像与视频生成任务中有效提升性能,为利用真实场景标量反馈提供了新途径。
寻找上海的城市视觉素材,既要新、又要多、还得可靠,有没有一个地方能同时满足这些要求? 最近有个平台做了件挺实在的事。IP SHANGHAI,这个上海的城市形象资源共享平台,为了庆祝上线五周年,对其视觉版权交易系统进行了一次重要升级。核心变化在于,创作者现在可以自主为上传的原创图片和视频设定价格,而使
续集魔咒是 Hollywood 铁律——《Beef》第二季却打破了它 说来有趣,这部口碑不降反升的亚裔复仇剧续作,让观众印象最深的,往往不是那些戏剧性的剧情转折,而是每一集里一闪而过的怪诞画作。这本身,就挺反常的。 正方:视觉符号才是续作的灵魂 通常来说,续集为了维持热度,要么堆砌新角色,要么制造更
从单镜头到电影叙事:交互式AI视频生成的技术突破 这项由香港中文大学多媒体实验室、快手科技以及香港创新科技研究院联合开展的研究,已于2026年3月发表在计算机视觉顶级会议上,论文编号为arXiv:2603 25746v1。对技术细节感兴趣的读者,可以通过该编号查阅完整的学术论文。 当前的AI视频生成
原生Steam Link应用正式登陆苹果Vision Pro,实现4K高清游戏串流体验 游戏玩家们迎来重磅消息。根据知名科技媒体9to5Mac的报道,Valve已正式推出专为visionOS系统开发的原生Steam Link应用测试版。苹果Vision Pro用户现在即可通过TestFlight平台
热门专题
热门推荐
微信群里的接龙,方便是真方便,但整理起来,那叫一个头疼。手动复制粘贴,不仅耗时费力,还容易出错、遗漏,最后导出的表格格式五花八门,看着就心累。 有没有一种方法,能让这个过程自动化,让数据自己“跑”进表格里?答案是肯定的。借助一些工具,我们可以实现群内接龙数据的自动识别、解析和归档。下面,就来拆解一下
VineCoin(VINE币):重塑创作者经济的区块链新星 在数字资产的浪潮中,VineCoin(VINE币)正作为一个新兴项目崭露头角。它并非又一种简单的代币,其野心在于利用区块链技术,从根本上重塑内容创作与社交互动的经济规则。可以说,它致力于成为一个去中心化生态系统的核心引擎,目标是为全球的内容
ToClaw文件整理术:一键清理桌面杂乱文件的秘籍 | AI智能文件管理教程 利用AI智能助手整理电脑桌面文件,愿景虽好,但在实际应用中,你是否也遇到过分类不准确、指令执行失败,甚至文件被误移的困扰?请放心,这些问题往往源于几个关键的设置步骤尚未完善。掌握以下这套经过验证的ToClaw文件整理优化方
三星电子工会确认原定罢工计划未取消,但将遵守法院禁令,确保罢工不影响正常生产流程。劳资博弈进入微妙阶段,工会需在法律框架内施压,公司生产秩序暂获法律庇护,后续发展取决于双方谈判。
千问AI赋能社群自动化运营:一、关键词触发智能回复;二、定时任务精准推送;三、敏感词实时过滤预警;四、成员标签化智能分组。 社群运营工作繁杂,常常需要处理大量重复性任务,如解答常见问题、发布定时通知、监控群内动态等,这让运营者倍感压力。如何实现高效、智能的社群管理,解放人力?利用千问AI的强大功能,





