商汤徐立谈AI规模化爆发:语言与视觉融合是突破智能上限路径
“语言与视觉的深度融合是突破智能上限的高效路径。”
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
3月24日晚间,在人工智能公司商汤集团股份有限公司(商汤-W,0020.HK)业绩会上,商汤科技董事长兼CEO徐立表示:“我们深信语言与视觉的深度融合是突破智能上限的高效路径。我们基于NEO原生架构,高效实现理解与生成统一,探寻多模态的新‘尺度定律’。这一系列技术突破和智能体AI的深度结合将打开新的应用可能性,赋能全新垂直场景。”

当天,商汤科技发布了全年业绩公告。2025年总收入50.15亿元,同比增长32.9%,创历史新高,增速为近三年最快;净亏损17.82亿元,大幅收窄58.6%;经调净亏损19.56亿元,同比收窄54.3%;下半年息税折旧摊销前利润(EBITDA)3.8亿元,为上市后首次转正。
按业务来看,生成式AI业务收入36.29亿元,同比大幅增长50.98%;视觉AI业务收入10.83亿元,保持平稳;X创新业务收入3.02亿元,同比减少5.92%。
商汤表示,生成式AI业务收入大增主要是由于市场需求持续爆发性增长,以及一体化产业解决方案促进了计算平台、模型及应用的联合商业化;而X创新业务的减少主要归因于智能驾驶业务脱离综合财务报表,随着时间的推移,预期X创新业务的构成会发生演变,未来该特定收入的同比数据比较意义将降低。
商汤科技联合创始人、执行董事、首席科学家林达华也表示,随着春节后OpenClaw的“走红”,带来了Token(词元)消费的显著增长,整个行业也走向了Agentic AI(智能体AI)时代。
林达华指出,纯语言数据已经见顶,语言和视觉的深度融合,将会成为突破AI智力上限的关键路径。在软件AI时代,很多复杂业务场景都会涉及多模态信息综合处理。将智能体的视觉能力和语言处理深度连接,可以显著提升复杂任务的成功率和效率,并且大幅度降低token消耗。商汤此前推出的NEO架构打破了传统拼接架构,进行了底层的多模态原生改造,提升了学习和推理效率,用1/10的数据量就能达到SOTA(最先进,State-Of-The-Art)性能。
据透露,商汤将在今年第二季度发布新版NEO架构,效率还将再提升2-3倍。

商汤科技联合创始人、大装置事业群总裁杨帆也表示,现在上千P(PetaFlops,1P相当于每秒1000万亿次计算速度)甚至几千P的单一集群客户越来越多,商汤的整体算力规模已经达到4.04万P,其中国产算力超过5500P,规模越来越大。
杨帆表示,商汤会利用技术积累,与国产厂商一起不断进行软硬件联合优化,提升性价比,拓展可适用模型范围,让越来越多的公司接受并拥抱国产体系。

对于未来发展规划,徐立表示:“展望2026年,我们看到AI真正迎来了规模化的爆发阶段。商汤也已经做好了准备,接下来的发力点也比较清晰和明确。”
徐立表示,首先要坚持原生多模态的路径,通过技术落高定义AI的新范式和智能的新高度,确立在AI前沿领域的领先地位;其次要深耕产业智能化,打造Agent原生时代的入口,“我们相信AI会从辅助工具进化为真正的生产力,在泛办公、教育、营销、智能终端等这些垂直赛道,我们要抢占入口,实现流量和商业价值的双向爆发”;第三,要把单位智能成本压到极致,依托算力、模型、应用协同要持续降低推理成本,全力推动国产算力从可用走向好用;第四,视觉AI要跑出规模化红利,握紧CV(计算机视觉,Computer Vision)2.0时代的盈利密码,推动业务的规模化扩张和规模化利润;同时,还要坚持海内外双引擎发力,把商汤方案做到AI产业标杆。
徐立最后还指出,要持续兑现“1+X”的生态红利,进一步优化“母舰+子舰”的协同模式,和生态伙伴一起抓住垂直行业爆发带来的增值红利。
3月25日,商汤股价盘中最高涨幅5.76%,达2.02港元/股,截至收盘跌1.57%,报收1.88港元/股。
此外,澎湃新闻还获悉,在即将召开的2026全球开发者先锋大会上,商汤科技将带来基于多模态大模型的智能应用商汤输入法AudioClaw以及AI语音开放平台SenseAudio两项AI语音技术成果。
相关攻略
最近有支叫《霍去病》的 AI 短片让我印象深刻,播放量轻松破亿,逼真得让人以为是重工业大制作。真相是:3 个人,48 小时,从立项到成片。 核心创作者还不是影视科班出身,人家之前只是一名内容运营。同
3月27日至29日,2026全球开发者先锋大会(GDPS 2026)在上海西岸国际会展中心举行。在“AI+时代的企业创新与OPC发展论坛”上,上海智灵新境科技有限公司CEO费元华分享观点称:情感与审
3月26日消息,近日,长城魏牌CEO赵永坡发布视频谈到辅助驾驶传感器,其直言称“激光雷达数量越多,体验并不一定会越好,堆硬件有时是取巧。”这样的观点显然并不被所有人认可,今日下午,岚图汽车CEO卢放
新智元报道编辑:犀牛【新智元导读】从「被动感知」到「主动预测」,首个视触觉世界模型让机器人真正学会「理解接触」。想象这样一个场景:你正在擦桌子、削水果,或者插拔一个精密零件。这些动作对人类来说轻而易
“语言与视觉的深度融合是突破智能上限的高效路径。”3月24日晚间,在人工智能公司商汤集团股份有限公司(商汤-W,0020 HK)业绩会上,商汤科技董事长兼CEO徐立表示:“我们深信语言与视觉的深度融
热门专题
热门推荐
猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆
据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向
3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长





