
12月18日,火山引擎Force原动力大会正式召开,会上豆包大模型1.8版本重磅亮相。其在多模态Agent领域展现出的综合能力已跻身国际先进行列。
新版本针对多模态Agent的实际应用场景进行了深度专项优化,显著提升了工具调用的精准性与灵活性、复杂指令的理解与执行能力,以及系统级代理任务的处理效率。这让模型在面对复杂任务时,具备了更强的规划能力和执行效能。
多项权威评估结果显示,豆包大模型1.8在视觉推理、通用视觉问答、空间理解和视频内容理解等多个核心任务中,均取得最优或接近最优的表现。它在通用智能体测评集BrowseComp上的综合表现,同样稳居全球前列。与此同时,在数学推导与逻辑推理等语言模型核心能力方面,其整体性能也已逼近国际领先水准的通用大模型。
目前,豆包大模型1.8已在火山引擎平台全面开放API接口,供企业与开发者便捷接入使用。
同期发布的还有豆包音视频创作模型Seedance 1.5 pro。该模型原生支持音频与视频的联合生成,在视听协同性、画面表现力以及叙事连贯性等方面均实现了显著的技术突破。此功能目前已在豆包App(灰度测试)、即梦AI及火山引擎体验中心上线并提供体验。
