Gemini 3 Pro登顶多模态评测:豆包、Qwen3-VL展现中国AI实力

2025年12月31日,一份最新的多模态视觉语言模型综合能力评测结果正式公布。在这次评估中,谷歌研发的Gemini-3-pro凭借83.64分的成绩位列榜首,展现出强劲的技术实力。字节跳动推出的豆包大模型获得73.15分,跻身榜单前三名,体现了国内企业在多模态人工智能领域的快速进步。
本次评估从基础认知、视觉推理和视觉应用三个层面全面考察了各模型的表现。Gemini-3-pro在三项指标中均取得领先,分别获得89.01分、82.82分和79.09分,整体性能优势明显。
在国内模型中,商汤科技的SenseNova V6.5 Pro以75.35分排名靠前,紧随其后的是豆包视觉版。该版本在基础认知方面表现优异,得分达到82.70,优于部分国际同类产品,仅在视觉推理环节略有不足。
此外,百度研发的ERNIE-5.0-Preview与阿里巴巴推出的Qwen3-vl也双双进入前五名。其中,Qwen3-vl成为本次榜单中唯一一个总分突破70分且开放源代码的模型,显示出较高的技术透明度与社区支持潜力。
在国际主流模型中,Anthropic公司开发的Claude-opus-4-5获得71.44分,而OpenAI的GPT-5.2(high)得分为69.16分,排名处于中下游位置。评测结果显示,当前多模态模型竞争格局正持续演变,国内外技术差距逐步缩小,多个本土模型已在关键能力上具备全球竞争力。
热门专题
热门推荐
上海启动全球首颗光计算卫星研制,其天基光计算具备抗辐照、低功耗特性,适应太空环境,可支撑在轨大算力任务。目前芯片太空验证已完成,全链条研制能力基本形成。产业面临成本与规模化挑战,需重构航天制造体系。长三角已成立创新联合体聚焦七大技术攻坚,上海将天基计算列为未来。
苹果与OpenAI合作因商业回报未达预期出现裂痕。腾讯地图推出AI骑手模式优化配送。百度成立模型委员会强化AI布局。荣耀将发布搭载云台系统的RobotPhone。Anthropic拟以9000亿美元估值融资。阿里发布智能体开发工作台Qoder1 0。千问APP接入药监局数据。发那科与英伟达深化合作,利用AI加速机器人开发。
面对海量书籍资源,数字化管理工具至关重要。小满图书管理侧重会员与库存管理,适合书店。库存管理通轻量化,支持多货品进销存。藏书馆兼具藏书管理与数字阅读功能。移动图书馆对接高校资源,提供学术服务。个人图书馆专注个人知识收集与创作。各类软件功能各异,需根据核心需求选择。
英文朗读软件能有效辅助学习。推荐几款特色应用:全能型《朗读器》操作简便;《朗读者》结合翻译与朗读;《英文翻译》支持长文朗读;《朗读大师》擅长图像识别与发音反馈;《中英文翻译》提供系统化学习路径。根据需求选择工具并坚持练习,可提升理解与发音能力。
飞机是远距离出行的高效选择,提前购票可锁定行程并享受优惠。主流购票平台包括飞猪旅行、携程旅行、航班管家、美团、飞行卡和去哪儿旅行。这些应用不仅提供机票预订,还整合酒店、景点门票、本地生活等服务,满足用户对价格、一站式规划或特定优惠的不同需求。





