豆包语音识别2.0升级:新增13国外语,听得懂文字看得懂图
12月5日消息,火山引擎今日发布了豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于Seed混合专家大语言模型架构构建。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,2.0版本模型在推理能力方面显著提升,通过深度理解上下文情境实现精准识别,上下文整体关键词召回率提升了20%。
同时该模型支持多模态视觉识别,不仅能够"听懂文字",还能"看懂图片",借助单图和多图等视觉信息输入,使文字识别更精准。

此外,2.0版本还支持日语、韩语、德语、法语等13种外语的精准识别。

新版本重点针对专有名词、人名、地名、品牌名称及易混淆多音字等复杂场景进行了升级优化。
以历史人物生平讨论场景为例,当用户提到苏轼谦称"筠(yún)州"时,若模型缺乏推理能力容易将其误识为同音的"云州""郓州"等。
而豆包语音识别模型2.0可依托"当前讨论苏轼、苏辙"这一背景,即使上下文中从未出现过"筠州",也能通过逻辑推理锁定用户所指的特定地名,最终实现对多音字地名的精准识别。

目前,豆包语音识别模型2.0已上线火山方舟体验中心,并对外提供API服务。

相关攻略
南都讯 记者樊文扬 蒋小天 发自海南博鳌 3月26日,中兴通讯股份有限公司董事长方榕现身博鳌亚洲论坛2026年年会,并在一场分论坛上发言。去年这位强技术背景出身的女董事长接棒以后,中兴与字节跳动豆包
“AI是啥?”3月25日,在重庆市永川区永昌街道星光社区便民服务中心的大厅里,72岁的吕奶奶一脸茫然地问道。AI对年轻人来说触手可及,早已融入日常。可对于留守老人和不便出门的残疾人来说,它却遥远又陌
记者使用AI生成。近期,“养龙虾”热潮来袭,不少用户在“FOMO(害怕错过)”情绪下涌入“养虾”市场,甚至不惜花钱也要部署OpenClaw。“龙虾”究竟好不好用?有多“费钱”?是否会泄露隐私?对此,
AWE,也就是中国家电及消费电子博览会这几天正在上海火热举行,而也就在最近,养“龙虾”成为最热话题,在这次AWE2026展会上,OpenClaw带来的AI自主热潮也在延续,无需人类干预的AI手机甚至
不懂如何定义工作流的“小白”,装龙虾只是自寻烦恼。文|《中国企业家》记者 闫俊文见习编辑|李原编辑|何伊凡头图来源|视觉中国2026年开年,养“龙虾(OpenClaw)”热潮愈演愈烈,但一边有人“抢
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





