当前位置: 首页 > 科技 > 文章内容页

文心4.5 Turbo登顶SuperCLUE多模态榜单,性能比肩GPT-5

时间:2025-08-29    作者:游乐小编    

8月28日,中文多模态视觉语言模型测评基准SuperCLUE-VLM正式公布了8月榜单。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分的成绩,在国内模型中并列第一,尤其在真实场景任务中展现出明显优势。

本次评测涵盖了来自国内外的15款主流多模态模型,包括Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等。

SuperCLUE多模态视觉评测榜出炉:文心4.5

SuperCLUE-VLM围绕中文场景特点,从基础认知、视觉推理和视觉应用三大维度展开全面测评,重点考察模型在真实任务中的综合表现。

测评结果显示,Gemini-2.5-Pro以总分74.99分位居榜首,OpenAI GPT-5(high)以68.59分排名第二,百度ERNIE-4.5-Turbo-VL-32k-preview则以66.47分的成绩并列国内第一。

SuperCLUE多模态视觉评测榜出炉:文心4.5

有分析指出,文心大模型在多模态领域的多个维度均表现突出。ERNIE-4.5-Turbo-VL等国内头部模型在视觉推理、视觉应用等高阶任务上的显著进步,展现出中国在多模态大模型领域的竞争实力。

据悉,百度于6月30日开源了文心4.5系列的10款模型。其中,ERNIE-4.5-VL视觉语言模型具备强大的图文与视频理解能力,支持超过100种语言交互,其跨模态能力广泛覆盖文档处理、视频管理、学习解题等多个核心任务场景。

SuperCLUE多模态视觉评测榜出炉:文心4.5

作为国内最早布局大模型研发的企业,百度依托“芯片-框架-模型-应用”全栈自研体系,持续推动文心大模型的能力升级。

通过飞桨与文心的协同优化,文心大模型在能力拓展和运行效率方面实现显著提升。

截至目前,飞桨文心平台的开发者数量已突破2185万,服务企业超过67万家,累计创建的模型数量达到110万个。

热门推荐

更多

热门文章

更多

首页  返回顶部

本站所有软件都由网友上传,如有侵犯您的版权,请发邮件youleyoucom@outlook.com