时间:2025-08-29 作者:游乐小编
8月28日,中文多模态视觉语言模型测评基准SuperCLUE-VLM正式公布了8月榜单。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分的成绩,在国内模型中并列第一,尤其在真实场景任务中展现出明显优势。
本次评测涵盖了来自国内外的15款主流多模态模型,包括Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等。
SuperCLUE-VLM围绕中文场景特点,从基础认知、视觉推理和视觉应用三大维度展开全面测评,重点考察模型在真实任务中的综合表现。
测评结果显示,Gemini-2.5-Pro以总分74.99分位居榜首,OpenAI GPT-5(high)以68.59分排名第二,百度ERNIE-4.5-Turbo-VL-32k-preview则以66.47分的成绩并列国内第一。
有分析指出,文心大模型在多模态领域的多个维度均表现突出。ERNIE-4.5-Turbo-VL等国内头部模型在视觉推理、视觉应用等高阶任务上的显著进步,展现出中国在多模态大模型领域的竞争实力。
据悉,百度于6月30日开源了文心4.5系列的10款模型。其中,ERNIE-4.5-VL视觉语言模型具备强大的图文与视频理解能力,支持超过100种语言交互,其跨模态能力广泛覆盖文档处理、视频管理、学习解题等多个核心任务场景。
作为国内最早布局大模型研发的企业,百度依托“芯片-框架-模型-应用”全栈自研体系,持续推动文心大模型的能力升级。
通过飞桨与文心的协同优化,文心大模型在能力拓展和运行效率方面实现显著提升。
截至目前,飞桨文心平台的开发者数量已突破2185万,服务企业超过67万家,累计创建的模型数量达到110万个。
2021-11-05 11:52
手游攻略2021-11-19 18:38
手游攻略2021-10-31 23:18
手游攻略2022-06-03 14:46
游戏资讯2025-06-28 12:37
单机攻略