豆包语音识别大升级:2.0版支持13种外语实时转写
凤凰网科技12月5日讯,火山引擎今日正式推出豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),该模型基于自主研发的Seed混合专家大语言模型架构精心打造。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据官方披露,2.0版本在推理能力方面实现显著提升,能够通过深度理解语义上下文完成精准识别,整体关键词召回率较上一代提升达20%。同时全面支持多模态视觉识别技术,实现"听得懂更能看得懂"的突破,可借助单图或多图等视觉输入有效提升文字识别精度。
新版模型现已支持日语、韩语、德语、法语等13种海外语言的语音识别,并重点针对专业名词、人名地名、品牌称谓及多音字混淆等复杂场景进行了专项优化升级。
热门专题
热门推荐
4月3日消息,今日,vivo年度影像旗舰X300 Ultra正式开售,新机定位专业V单+口袋摄影机,影像能力全面拉满。vivo X300 Ultra配备蔡司大师镜头群,覆盖14mm蔡司超广角、35m
4月2日消息,微软资深Windows工程师Raymond Chen发布长文,呼吁用户和企业IT团队,不要每次在系统出现问题后就第一时间将责任归咎于Windows更新。Chen指出,许多被归咎于每月更
近期,日本玩家围绕卡普空旗下女性角色视觉风格的变迁展开了广泛讨论。有玩家将十年前以当时技术水准塑造的代表性美少女角色玛莉·萝丝,与近年运用最新技术打造的英格丽德进行对比,认为后者在角色表现力上并未体
有多少资深玩家还记得AQUAPLUS旗下那款经典的恋爱冒险作品ToHeart?多年来,关于推出第三部续作的呼声始终不绝于耳。然而,这一计划事实上已被官方终止。近日,该公司社长在一次访谈中透露了项目搁
2026年4月5日,电动自行车行业正面临双重压力:国家层面的以旧换新补贴政策正式退出,叠加原材料成本持续攀升,导致终端售价普遍上调,市场销售明显承压。根据2026年最新实施的消费品以旧换新政策,电动





