字节跳动发布豆包大模型2.0：真实世界复杂任务执行能力升级

在连续发布Seedance 2 0视频模型、Seedream 5 0 Lite图像模型之后，2月14日，字节跳动宣布推出豆包大模型2 0（Doubao-Seed-2 0）系列。豆包2 0针对大规模生

继连续发布Seedance 2.0视频模型与Seedream 5.0 Lite图像模型后，字节跳动于2月14日正式推出豆包大模型2.0系列。该版本针对大规模生产环境需求进行了系统性优化，旨在更高效地完成现实世界中的复杂任务。

在语言模型基础能力方面，豆包2.0 Pro旗舰版在IMO、CMO数学竞赛及ICPC编程竞赛中斩获金牌，其数学与推理能力更超越Gemini 3 Pro在Putnam基准测试中的表现，达到全球顶尖水准。

执行长链复杂任务需要丰富的世界知识支撑。豆包2.0增强了长尾领域知识覆盖，在SuperGPQA等多项公开测试集上表现突出，科学领域知识测试成绩与Gemini 3 Pro及GPT 5.2相当，在跨学科知识应用方面也位居前列。

面对教育、娱乐、办公等多元场景，大模型需具备理解图表、复杂文档及视频内容的能力。豆包2.0全面升级多模态理解能力，在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现。

针对动态场景，豆包2.0增强了对时间序列与运动感知的理解能力，可实现实时视频流分析、环境感知与主动交互，广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。

字节跳动发布豆包大模型2.0，主打真实世界复杂任务执行力

图示：Agent及推理能力部分评测成绩

Agent能力是大模型具备行动力的关键。测试数据显示，豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水准，在HLE-Text评测中更获得54.2的最高分，大幅领先其他模型。

目前，豆包2.0 Pro已在豆包App、电脑客户端和网页版上线，用户选择专家模式即可对话体验。火山引擎也已上线豆包2.0系列模型API服务。

据悉，豆包2.0 Pro按输入长度区间定价，32k以内的输入定价为3.2元/百万tokens，输出定价为16元/百万tokens，相较Gemini 3 Pro和GPT 5.2具有显著成本优势。豆包2.0 Lite更具性价比，综合性能超越两个月前发布的上一代主力模型豆包1.8，百万tokens输入价格仅为0.6元。