
火山引擎推出突破性豆包大模型1.6-vision版本
10月1日,火山引擎正式发布具有里程碑意义的豆包大模型1.6-vision,这是该系列首次集成了工具调用功能的视觉深度思考模型。最新版本不仅在多模态理解与推理能力上实现了质的飞跃,还新增Responses API支持,以更优的性价比助力用户实现高精度视觉理解需求。
技术资料显示,1.6-vision版本通过创新的工具调用机制,能够将图像处理功能无缝融入推理过程,实现包括精确定位、智能裁剪、点位选择、线条绘制、尺寸缩放和角度旋转等复杂图像操作。其独特之处在于模拟人类"宏观把握到微观分析"的视觉认知模式,既增强了推理过程的可解释性,又显著提升了图像处理的精准度和效率。
在成本优化方面,新版本对比前代Doubao-1.5-thinking-vision-pro实现了质的突破,整体调用成本降低约50%。具体表现为:在典型的32K输入输出场景下,单次调用费用从原先的5.25元降至2.6元,大大提升了商用可行性。
值得回顾的是,火山引擎在今年6月推出的豆包大模型1.6已经显著增强了多模态处理能力。此次发布的1.6-vision版本更进一步,在视觉应用领域实现了更深层次的突破和技术落地。
