继连续发布Seedance 2.0视频模型与Seedream 5.0 Lite图像模型后,字节跳动于2月14日正式推出豆包大模型2.0系列。该版本针对大规模生产环境需求进行了系统性优化,旨在更高效地完成现实世界中的复杂任务。
在语言模型基础能力方面,豆包2.0 Pro旗舰版在IMO、CMO数学竞赛及ICPC编程竞赛中斩获金牌,其数学与推理能力更超越Gemini 3 Pro在Putnam基准测试中的表现,达到全球顶尖水准。
执行长链复杂任务需要丰富的世界知识支撑。豆包2.0增强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro及GPT 5.2相当,在跨学科知识应用方面也位居前列。
面对教育、娱乐、办公等多元场景,大模型需具备理解图表、复杂文档及视频内容的能力。豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现。
针对动态场景,豆包2.0增强了对时间序列与运动感知的理解能力,可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。

图示:Agent及推理能力部分评测成绩
Agent能力是大模型具备行动力的关键。测试数据显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水准,在HLE-Text评测中更获得54.2的最高分,大幅领先其他模型。
目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择专家模式即可对话体验。火山引擎也已上线豆包2.0系列模型API服务。
据悉,豆包2.0 Pro按输入长度区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相较Gemini 3 Pro和GPT 5.2具有显著成本优势。豆包2.0 Lite更具性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。
