Gemini 3 Pro登顶多模态评测:豆包、Qwen3-VL展现中国AI实力

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
2025年12月31日,一份最新的多模态视觉语言模型综合能力评测结果正式公布。在这次评估中,谷歌研发的Gemini-3-pro凭借83.64分的成绩位列榜首,展现出强劲的技术实力。字节跳动推出的豆包大模型获得73.15分,跻身榜单前三名,体现了国内企业在多模态人工智能领域的快速进步。
本次评估从基础认知、视觉推理和视觉应用三个层面全面考察了各模型的表现。Gemini-3-pro在三项指标中均取得领先,分别获得89.01分、82.82分和79.09分,整体性能优势明显。
在国内模型中,商汤科技的SenseNova V6.5 Pro以75.35分排名靠前,紧随其后的是豆包视觉版。该版本在基础认知方面表现优异,得分达到82.70,优于部分国际同类产品,仅在视觉推理环节略有不足。
此外,百度研发的ERNIE-5.0-Preview与阿里巴巴推出的Qwen3-vl也双双进入前五名。其中,Qwen3-vl成为本次榜单中唯一一个总分突破70分且开放源代码的模型,显示出较高的技术透明度与社区支持潜力。
在国际主流模型中,Anthropic公司开发的Claude-opus-4-5获得71.44分,而OpenAI的GPT-5.2(high)得分为69.16分,排名处于中下游位置。评测结果显示,当前多模态模型竞争格局正持续演变,国内外技术差距逐步缩小,多个本土模型已在关键能力上具备全球竞争力。
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





