科大讯飞AI翻译机发布:支持60语种互译,覆盖多场景
在近期举办的迪拜GITEX+Global科技盛会上,科大讯飞通过一场穿越时空的前沿科技对话,向全球展示了其在AI同传技术方面的最新突破。同步举行的线上发布会中,一款搭载"多融合AI降噪系统"的开放式翻译耳机正式亮相,标志着智能翻译设备从此进入"实时无界"的全新阶段。
这款被命名为"讯飞AI翻译耳机"的设备,创新性地采用"骨导+气导"双模式设计,配合30度精准拾音角度与多麦克风阵列,即使在嘈杂的展会现场也能清晰捕捉语音。其核心功能覆盖四大应用场景:跨洲际通话支持多任务并行处理;面对面翻译可实现双人无按键互译,并支持18种语言离线使用;线上同传集成双语翻译与会议录音功能;旁听模式则通过5-8米定向拾音满足大型会议需求。技术团队透露,该设备已实现60种语言的实时互译,中英同传延迟压缩至2秒以内,语音音色还原度超过90%,语调节奏与专业口译员几乎无异。
发布会现场,迪拜与国内研发中心的实时连线演示成为焦点。当两国工程师用阿拉伯语与中文展开技术讨论时,耳机同步完成的翻译不仅准确传达专业术语,更完美复现了对话者的情绪起伏。这种突破得益于端到端语音同传大模型的持续优化,使设备在医疗、制造、金融、法律等垂直领域的翻译准确率显著提升。
同期公布的升级计划显示,讯飞双屏翻译机2.0将于本月末迎来功能革新。新增的"讲话人分离"技术可在中英双语会议中自动识别发言人身份,并支持自定义姓名标注,彻底解决多语言会议中的"声源错位"难题。更引人注目的是会议纪要生成功能,通过接入星火认知大模型,设备能自动整理翻译内容并生成结构化摘要,用户可一键分享至多平台。
在互动体验区,科大讯飞搭建了全场景智能翻译生态展示区。除新款耳机外,讯飞翻译机、AI录音笔等硬件与翻译APP、同传系统等软件服务形成完整解决方案。参观者可通过模拟跨国谈判、国际会议等场景,直观感受从语音识别、实时翻译到内容管理的全流程智能体验。技术人员特别演示了线上同传的"双轨制"功能——既可提供实时字幕转译,又能同步生成可编辑的会议文档,为远程协作提供全新可能。
热门专题
热门推荐
水产市场是什么 在AI Agent的生态中,能力共享与协同进化是核心驱动力。水产市场(Seafood Market)正是为OpenClaw框架量身打造的AI Agent能力共享平台。你可以将其理解为AI领域的“应用商店”或“技能交易中心”,旨在实现AI能力的快速流通与组合创新。 目前,平台已集成超过
在信息爆炸的时代,高效地将音视频内容转化为可编辑、可检索的文字,已经成为内容创作者、研究者和职场人士的刚需。今天要聊的这款工具——MeowTXT,正是瞄准了这一痛点,它不仅仅是一个简单的转录工具,更是一个集成了智能识别、摘要和翻译的AI生产力平台。 MeowTXT是什么 简单来说,MeowTXT是一
OpenFang是什么 在AI Agent领域,我们常常面临一个困境:大多数系统仍然停留在“你说一句,它动一下”的被动模式,离真正的自动化还有距离。今天要聊的OpenFang,正是在尝试打破这个局面。它是一个用Rust语言构建的开源Agent操作系统,其核心创新在于引入了“Hands”的概念——你可
AngelSlim是什么 随着大模型参数规模不断增长,如何实现高效推理与低成本部署已成为开发者面临的核心挑战。腾讯混元团队推出的开源工具包AngelSlim,正是为解决这一难题而生。它是一个面向全模态大模型的综合压缩与加速解决方案,集成了量化、投机采样、稀疏化及知识蒸馏等前沿技术,旨在为各类大语言模
在信息过载的数字化时代,音频与视频内容已成为知识传递、创意表达与商业沟通的核心载体。然而,如何将这些宝贵的非结构化媒体资产,高效、精准地转化为可搜索、可分析、可编辑的文本格式,始终是内容创作者、市场研究人员、学者及商务人士的核心痛点。一款强大的AI转录工具,正是打通音视频内容价值闭环、释放生产力潜能





