文心4.5 Turbo登顶SuperCLUE多模态榜,总分并列国内第一
8 月 29 日消息,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8 月榜单正式发布,百度 ERNIE-4.5-Turbo-VL 多模态大模型以 66.47 分的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
本次评估覆盖 Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5 (high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest 等国内外 15 款多模态模型。基于中文场景特点,SuperCLUE-VLM 围绕基础认知、视觉推理和视觉应用三大核心维度进行评测,全面考察模型在真实任务场景下的能力。
测评结果显示,Gemini-2.5-Pro 以总分 74.99 分领先,OpenAI GPT-5 (high) 以总分 68.59 分位居第二,百度 ERNIE-4.5-Turbo-VL-32k-preview 以总分 66.47 分并列国内模型第一。有分析人士点评,文心大模型在多模态领域的多维度领先优势十分突出。ERNIE-4.5-Turbo-VL 等国内其他头部模型在视觉推理、视觉应用等高阶任务上的显著进步,凸显了中国在多模态大模型领域的竞争潜力。

SuperCLUE-VLM 多模态视觉语言基准评测总榜
据早前公开报道,6 月 30 日百度开源文心 4.5 系列 10 款模型,其中 ERNIE-4.5-VL 视觉语言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)具备复杂的图文与视频理解能力,支持超过 100 种语言交互,其跨模态能力覆盖文档处理、视频管理、学习解题等核心任务场景。
作为国内最早投入大模型产研的企业,百度依托“芯片-框架-模型-应用”的全栈自研体系,持续推动文心大模型能力进化。得益于飞桨文心的联合优化,文心大模型的能力拓展和效率提升。截至目前,飞桨文心开发者数量已超过 2185 万,服务超过 67 万家企业,创建的模型达到 110 万。
相关攻略
当在线 K 歌成为大众日常娱乐的重要方式,用户对音质、曲库、交互体验的要求也在不断提升。近日,鸿蒙版云视听全民 K 歌全新升级,登陆华为智慧屏 Mate TV,依托腾讯音乐娱乐集团强大的版权储备与
家人们看过来!穗好办 App HarmonyOS 5 版正式上线啦!鸿蒙 5 0 及以上系统可流畅使用,指尖办事体验直接跃升新维度!此外还有四大穗好办专属亮点等你来探索!鸿蒙级安全防护,为您的个人信
继芝麻信用牵手高德地图,打造全新线下信用服务体系后,芝麻信用信任生态再迎一位重磅伙伴。10 月 13 日,在 vivo X300 系列新品发布会上,双方正式宣布达成联合创新合作:芝麻信用正式成为 v
在当下竞争激烈的平板市场中,2000 左右的平板往往因成本限制难以在性能、便携、续航与智能体验上做到全面兼顾,而联想小新平板 Pro GT 却以“越级配置”打破常规 —— 搭载第三代骁龙 8 旗舰平
10 日 14 日,荣耀正式释放 MagicPad3 Pro 产品卖点,涵盖性能、生产力、互联、电量四大维度,全方位定义最强安卓平板。作为全球首款搭载第五代骁龙 8 至尊版芯片的平板,荣耀 Magi
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





