首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
阿里通义千问发布实时翻译模型Qwen3.5-LiveTranslate 延迟仅2.8秒

阿里通义千问发布实时翻译模型Qwen3.5-LiveTranslate 延迟仅2.8秒

热心网友
42
转载
2026-05-20

跨境直播卡顿、跨国会议延迟、AI配音机械感强……实时同传技术长期面临这些体验瓶颈。近日,阿里通义千问团队推出Qwen3.5-LiveTranslate-Flash实时语音翻译模型,针对行业痛点实现多项突破,在语种覆盖、延迟控制与音色保留等方面带来显著提升。

AI 同传 2.8 秒延迟,阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate

核心亮点速览

Qwen3.5-LiveTranslate-Flash主要带来以下关键升级:

  • 语种大幅扩展:支持输入音频语种从18种增至60种,输出文本语种同步扩展,输出音频语种从10种提升至29种。
  • 延迟显著降低:端到端字均延迟压缩至2.8秒,更适配直播、在线连麦等高实时性场景。
  • 音色得以保留:集成实时音色克隆技术,翻译输出语音可模仿说话人原声特征,提升听觉自然度。
  • 术语翻译更准:内置热词优先机制,能准确识别并翻译专有名词、行业术语,减少人名、机构名误译。

技术突破与应用场景

这些技术参数在实际应用中意味着什么?

首先是覆盖更广。60种输入语言与29种输出语言的组合,极大拓宽了实时翻译的适用场景。无论是跨境会议、直播出海、在线教育还是国际商务洽谈,多语言实时互译需求得到更全面满足。

其次是延迟更低。这得益于创新的“可读单元”流式翻译技术。该技术在保证译文可读性与语义连贯的前提下,实现更激进的流式输出策略,从而将字均延迟控制在2.8秒以内。对于发布会、直播带货等场景,几秒的延迟优化能带来明显的体验提升。

再者是音色更真。模型采用动态跨语言音色克隆技术,可在同传过程中实时捕捉并复现说话人的音色特征。这使得不同语言间的翻译输出听起来像是“同一人”在发言,有助于保持主播或演讲者的身份一致性,增强听众的沉浸感。

最后是翻译更准。内置的动态热词引擎最高支持1000条自定义词条。在技术研讨、医疗会诊、法律咨询等专业场景中,系统可优先确保关键术语、品牌名称、地名等专有词汇的翻译准确性,有效降低因术语错误导致的沟通风险。

实战表现如何?

技术指标需经实践检验。从典型场景测试来看,该模型表现稳定可靠:

跨国会议与出境旅游场景中,面对多语种交替发言或带口音的表述,模型能精准切分并同步翻译。更值得一提的是,当其与智能硬件结合时——例如在泰国使用搭载该技术的AI眼镜进行点餐——语音交互与实时同传可无缝衔接,大幅降低语言障碍。

直播带货与影视出海领域,模型对数字、规格等细节信息的翻译准确率较高,确保商品参数、价格等在跨语言连麦中传递无误。即便面对古典文言文等富含文化内涵的内容,也能实现语义连贯的翻译,并保持字幕与配音的流畅同步。

此外,模型还具备一定的视觉消歧能力。当遇到一词多义导致的语境模糊时,可结合多模态理解引入视觉信息辅助判断,从而选择更贴切的译法,进一步提升翻译准确度。

性能与代际对比

根据官方测试数据,在FLEURS、CoVoST2等主流多语言语音翻译基准中,Qwen3.5-LiveTranslate-Flash的翻译准确率优于当前同类语音大模型,也显著超越前代产品Qwen3-LiveTranslate-Flash。

延迟优化尤为突出。通过可读单元流式策略,新模型相比前代将首字延迟降低3.45秒,字均延迟降低1.88秒,最终实现2.8秒的端到端字均延迟,且翻译质量几乎无损。

总体而言,Qwen3.5-LiveTranslate-Flash基于Qwen3.5-Omni Thinker-Talker架构,融合chunk-wise流式输入、可读单元合成控制、动态音色克隆等多项技术,在核心性能与功能体验上实现全面升级。

从“能翻译”到“实时同传”,每一次技术迭代都在为跨境协作、内容出海与智能硬件铺设更顺畅的沟通桥梁。更低延迟、更多语种、更自然音色的结合,或许正标志着新一代实时语音翻译基础设施的到来。

来源:https://www.ithome.com/0/952/903.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

千问Qwen如何实现会计审计中的报表分析
AI资讯
千问Qwen如何实现会计审计中的报表分析

在会计审计实务中,如何从格式复杂的财务报表中高效提取数据并完成专业分析,是提升工作效率的关键挑战。传统OCR技术与规则引擎常因文档结构混乱、跨页表格、附注嵌套等问题而力不从心。如今,借助通义千问(Qwen)系列大模型,我们可以构建一套覆盖图像解析、深度分析到底稿生成的智能化全流程解决方案。本文将详细

热心网友
05.20
千问Qwen如何配置Prompt缓存以降低延迟
AI资讯
千问Qwen如何配置Prompt缓存以降低延迟

合理配置千问Qwen的prompt缓存机制可显著降低延迟。隐式缓存自动识别重复前缀,需保持请求结构一致。显式缓存适合固定模板,需注册并指定缓存键。vLLM部署可启用前缀缓存,Transformers则需手动管理past_key_values参数。调试时可禁用缓存以获取基线数据。

热心网友
05.20
阿里千问Qwen3.7-Max-Preview登陆Arena AI 多项能力跻身全球前列
AI资讯
阿里千问Qwen3.7-Max-Preview登陆Arena AI 多项能力跻身全球前列

【快讯】阿里云旗下千问大模型家族迎来了新成员——最新预览版本Qwen3 7-Max-Preview与Qwen3 7-Plus-Preview已正式登陆Qwen Chat及Arena AI平台。这意味着,在即将到来的5月20日阿里云峰会正式发布前,业界和开发者已经可以提前一睹其风采。 作为Qwen3

热心网友
05.20
阿里通义千问Qwen3.7预览版模型功能详解
业界动态
阿里通义千问Qwen3.7预览版模型功能详解

阿里通义千问推出下一代旗舰模型预览版Qwen3 7Preview,包含主打极致推理的Max版和侧重长上下文与性价比的Plus版。模型在编程基准和LMSYS竞技场表现领先,支持多模态输入与超长上下文处理,采用混合专家架构等技术创新,适用于软件开发、企业知识管理等多类场景。

热心网友
05.19
Qwen 3.7 Max预览版发布 两代超大杯模型同步更新
AI资讯
Qwen 3.7 Max预览版发布 两代超大杯模型同步更新

Qwen3 7系列预览版在竞技场榜单首次亮相,其中Qwen3 7-Max-Preview在文本综合能力榜位列全球第13,助力阿里机构排名升至第6,并居国产模型首位。Qwen3 7-Plus-Preview则在视觉榜单排名第16,使阿里视觉机构排名跃至第5。两款模型在多个细分领域也进入全球前十。自Qwen3系列起,模型迭代明显加速,预览版先行测试、正式版后续发

热心网友
05.19

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

FineShare Singify AI翻唱生成器制作歌曲教程
AI教程
FineShare Singify AI翻唱生成器制作歌曲教程

AI技术在音乐创作领域的应用正不断深化,从基础的智能编曲发展到如今备受关注的AI歌曲翻唱。FineShare Singify作为一款专业的AI翻唱生成工具,让用户能够轻松将任意歌曲转换为由虚拟歌手演绎的全新版本,为音乐二次创作带来了更多可能性。 本质上,Singify是一个高度智能的“AI歌声转换器

热心网友
05.20
DeepFloyd IF 是什么 Stability AI 最新图像生成模型详解
AI教程
DeepFloyd IF 是什么 Stability AI 最新图像生成模型详解

在AI绘画与文本生成图像领域,开源社区迎来了一位实力强劲的新选手:DeepFloyd IF。该模型由StabilityAI旗下的DeepFloyd实验室研发,其核心采用了一种创新的模块化、级联式神经网络架构,专门用于生成超高分辨率的高质量图片。 通俗地讲,你可以将它看作一个分工明确的“专家团队”。生

热心网友
05.20
Shiba Inu与狗狗币价格走势分析 比特币关键阻力位82000美元如何影响市场
web3.0
Shiba Inu与狗狗币价格走势分析 比特币关键阻力位82000美元如何影响市场

柴犬币(SHIB)图表形态逆转:更高低点预示趋势转变 在经历了数月的低迷与方向不明的盘整后,柴犬币(SHIB)的日线图表终于呈现出一个关键且清晰的技术信号:一系列更高的低点正在形成。这标志着此前主导市场的“更低的高点和更低的低点”的下降趋势结构已被打破,一种新的、更具建设性的价格形态正在确立。对于资

热心网友
05.20
福特警告欧洲强制电动化政策可能产生反效果
业界动态
福特警告欧洲强制电动化政策可能产生反效果

福特搁置欧洲2030年全面停售燃油车计划,因市场电动化进程不及预期。公司认为强制淘汰政策或适得其反,可能导致老旧高排放车辆持续使用,反而延缓减排。福特呼吁调整法规,为混合动力等过渡技术提供空间,并计划推出燃油与电动新车型以重振市场。

热心网友
05.20
特斯拉Cybertruck涉水行驶失败 车主实测后车辆进水被逮捕
业界动态
特斯拉Cybertruck涉水行驶失败 车主实测后车辆进水被逮捕

特斯拉Cybertruck车主为测试车辆“涉水模式”,故意将其驶入湖泊,导致车辆进水失去动力,人员被迫弃车逃生。警方以违反水域安全法规等多项指控逮捕司机。官方手册明确该模式仅适用于浅水区域,且涉水损坏不在保修范围内。此次事件警示公众需遵守法规并重视安全警告。

热心网友
05.20