首页 游戏 软件 资讯 排行榜 专题
首页
AI
商汤科技发布日日新5o 国内首款实时多模态交互模型对标GPT-4o

商汤科技发布日日新5o 国内首款实时多模态交互模型对标GPT-4o

热心网友
68
转载
2026-05-16

2024年7月5日,上海世界人工智能大会盛大开幕。作为大会战略合作伙伴,商汤科技在其主办的“大爱无疆·向新力”人工智能论坛上,重磅发布了国内首个实现“所见即所得”交互体验的多模态大模型——“日日新5o”。这款模型旨在提供一种可对标GPT-4o的全新交互范式,将多模态实时对话从技术概念推向可感知、可体验的现实应用。

那么,究竟什么是“所见即所得”的AI交互?简单来说,它意味着人工智能能够像人类一样,同步接收、处理并理解来自语音、文本、图像及视频的混合信息流,并给出实时、流畅的反馈。这不再是简单的多模态识别与信息拼接,而是一种更接近人类自然对话的融合感知与理解能力。

论坛现场的实时演示,生动诠释了“日日新5o”的这一核心能力。工作人员刚刚向模型发出问候,“日日新5o”便通过设备摄像头,自动识别出工作人员胸卡带上的字样,随即准确判断出:“这里是世界人工智能大会会场”,并幽默地表示在此可以“好好学习,天天向上”。

接下来的展示环节更具趣味性。当工作人员拿起一只小狗玩偶时,模型不仅准确描述了小狗的外貌特征和憨态可掬的表情,还特别注意到了它头上那顶印有商汤科技Logo的白色帽子,细节捕捉能力相当出色。

演示难度随即升级。工作人员随机翻开一本书的任意一页,“日日新5o”的表现超越了简单的OCR文字识别。它能够快速理解页面上的图文混合布局与内容逻辑,并给出一个清晰、易懂的摘要总结,整个响应过程几乎在瞬间完成,交互流畅度令人印象深刻。

最能体现其“人性化”交互特质的,或许是对简笔画的实时理解与反馈。工作人员随手画了一只小兔子,模型直呼“可爱”。随后,一个简单的微笑表情被画出,模型能从中捕捉到平静、愉悦的情绪;当工作人员添上一笔,将嘴巴画大并加上舌头时,模型立刻反馈道:“这个表情看起来开心多了”。这种能听、会看、懂意图,并能主动延伸话题的交流方式,让AI对话拥有了几分与真人聊天的自然感与温度。

这种强大的实时多模态交互能力,尤其适用于需要自然连续对话和复杂场景深度理解的各类应用场景。其卓越表现的背后,是“日日新5.5”基础模型能力的全面进化与升级作为坚实支撑。

模型能力再进化:从性能对标到体验对齐

回顾今年4月,商汤发布的“日日新5.0”大模型已被业界视为国内首个在综合性能上对标GPT-4 Turbo的国产大模型。而短短两个多月后,全面升级的“日日新5.5”体系便宣告登场。据悉,其综合性能平均提升幅度超过30%,特别是在数学推理、英文理解以及复杂指令跟随等方面进步显著。正是这些核心能力指标的跨越式提升,为其在终端交互体验上实现与GPT-4o的对标奠定了坚实基础。

在技术架构层面,“日日新5.5”采用了创新的混合专家模型架构,并实现端云协同推理。这种设计旨在最大限度发挥云端强大算力与边缘侧低延迟的优势,从而在显著提升模型能力的同时,有效优化与控制推理成本。模型的训练数据规模已超过10TB tokens,其中包含了大量用于提升逻辑思维与推理能力的合成思维链数据,这是其复杂问题解决能力增强的关键因素之一。

降低应用门槛:“大模型0元Go”计划正式启动

为了助力更多企业与开发者能够以极低门槛体验并应用“日日新”大模型的先进能力,商汤科技近期同步推出了“大模型0元Go”普惠计划。根据该计划,新注册企业用户将获得一个包含模型调用、数据迁移、训练支持等多项专业服务的免费资源礼包。此外,商汤还将直接赠送高达5000万Tokens的免费额度,并为有意从OpenAI等平台迁移的用户配备专属技术顾问,旨在实现“零服务成本”的平滑、无忧迁移。

从快速迭代的模型升级,到实时流畅的多模态交互演示,再到旨在吸引开发者的普惠计划,商汤科技这一系列紧密的动作清晰地表明,国产大模型的发展正从技术层面的追赶,迈入以用户体验为核心竞争力的新阶段。未来的竞争焦点,或许将不止于学术基准测试的分数高低,更在于谁能提供更自然、更实用、更触手可及的智能交互体验。

来源:https://www.leiphone.com/category/ai/J8pZVmhIZTiINli2.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

商汤科技获评中国AI咨询服务市场领导者
AI
商汤科技获评中国AI咨询服务市场领导者

IDC报告将商汤科技定位为中国AI咨询服务市场领导者。其凭借“大装置-大模型-应用”战略与全流程专家服务,帮助企业应对AI落地中的成本、适配与安全挑战,实现从战略规划到持续运营的全周期支持。目前服务已扩展至金融、能源、交通等多个领域。

热心网友
05.16
商汤免费1500次背后有何商业布局与战略考量
AI
商汤免费1500次背后有何商业布局与战略考量

生态与工具链,正成为大模型竞争下半场的决胜关键。最近,商汤科技的一系列动作,为这个判断提供了一个生动的注脚。 当大多数同行还在琢磨如何将强大的模型能力变&现收费时,商汤却反其道而行之:推出首月每5小时1500次的免费调用额度,宣称Token消耗比同行低60%,三款新产品同步上线,甚至将核心模型U1以

热心网友
05.13
商汤Lite模型限时免费调用Token消耗直降60%
AI
商汤Lite模型限时免费调用Token消耗直降60%

2025年5月8日,商汤科技正式推出其新一代轻量化多模态智能体模型——日日新SenseNova 6 7 Flash-Lite。此次发布同步开启了SenseNova Token Plan的限时免费开放,并将全线办公技能SenseNova-Skills在GitHub平台全面开源,旨在为开发者提供更便捷的

热心网友
05.12
首创全场景多设备协同智能终端 商汤绝影发布AI智能硬件产品可悠
科技数码
首创全场景多设备协同智能终端 商汤绝影发布AI智能硬件产品可悠

商汤绝影发布可悠(Care U):从“陪你聊天”到“帮你做事”的家庭AI新成员 4月8日,商汤绝影旗下迎来了一位重磅“新成员”——AI智能硬件产品“可悠(Care U)”。这款产品的定位很有意思,它试图完成的,是一次从“陪你聊天”到“帮你做事”的实质性跨越。 那么,它是如何实现这一步跨越的呢?关键在

热心网友
04.15
AI原生时代来临,商汤大装置如何重塑算力集群架构
AI
AI原生时代来临,商汤大装置如何重塑算力集群架构

近日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。商汤大装置首席架构师项铁

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜
业界动态
问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜

近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十

热心网友
05.16
追觅Aurora Lux系列手机发布 29款奢华设计全解析
业界动态
追觅Aurora Lux系列手机发布 29款奢华设计全解析

科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,

热心网友
05.16
SpaceX最快下周披露招股书 6月初启动全球路演计划
AI
SpaceX最快下周披露招股书 6月初启动全球路演计划

SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。

热心网友
05.16
NVIDIA扩展机器人微服务库加速人形机器人发展
AI
NVIDIA扩展机器人微服务库加速人形机器人发展

NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。

热心网友
05.16
OKX交易所安全性如何?资金风险与监管深度解析
web3.0
OKX交易所安全性如何?资金风险与监管深度解析

OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。

热心网友
05.16