首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
通义端到端语音交互模型FunAudioChat发布,体验高效AI对话新范式

通义端到端语音交互模型FunAudioChat发布,体验高效AI对话新范式

热心网友
24
转载
2025-12-23

12月23日,通义大模型正式发布新一代端到端语音交互模型Fun-Audio-Chat。该模型隶属通义百晓语音模型系列,是其首个专注于“语音对语音”直接对话能力的模型,支持用户通过语音输入与模型进行多轮自然交流。

通义端到端语音交互模型fun-Audio-Chat发布

从多项技术评测数据来看,该模型在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等多个权威语音与多模态评测基准上,均取得了当前开源模型中的领先成绩。其综合性能超越了多款同参数规模的模型,展现出其在语音理解、生成以及对话协同方面均衡而强大的综合能力。

Fun-Audio-Chat-8B是通义百晓语音模型家族的新成员。此前,该系列已包含语音转文字模型Fun-ASR和文字转语音模型Fun-CosyVoice3。与前两者不同,Fun-Audio-Chat-8B的核心目标是实现端到端的语音交互能力,能够直接应用于语音聊天、情感陪伴、智能终端交互以及语音客服等多种实际场景。目前,该模型已在魔搭社区、Hugging Face及GitHub同步开源。

在模型训练与架构设计方面,研发团队披露了两项关键技术路径。其一是采用了Core-Cocktail两阶段训练策略,通过分阶段引入语音与多模态能力,再与原有文本大模型参数进行融合微调。这种方法有效降低了新增能力对原有语言理解能力的干扰,缓解了“灾难性遗忘”问题。其二则是引入了多阶段、多任务的偏好对齐训练,使模型在真实语音对话中能更精准地捕捉语义与情绪线索,从而显著提升对话的自然度和流畅性。

算力效率是该模型的另一大亮点。Fun-Audio-Chat-8B采用了“压缩—自回归—解压缩”的双分辨率端到端架构,将音频帧率大幅降低至约5Hz。在保证语音合成质量的同时,这一设计有望节省近50%的GPU计算开销。在当前语音大模型普遍面临算力成本压力的背景下,这一优化具有重要的工程实践意义。

综合来看,Fun-Audio-Chat-8B的开源,标志着通义大模型在语音交互方向上,正进一步朝着“低算力、强对话”的实用化阶段推进。这同时也为开源语音大模型在真实业务场景中的部署与应用,提供了新的技术思路和实践参考。

来源:https://tech.ifeng.com/c/8pK9L6VFYYD
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

深度剖析Qwen3.5-Omni:全模态感知与生成核心能力详解
AI资讯
深度剖析Qwen3.5-Omni:全模态感知与生成核心能力详解

3月30日,千问宣布上线Qwen3 5-Omni。Qwen3 5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文,模型支持超过10小时的音频输

热心网友
03.31
Dreame智控S6评测:2799元配6英寸IPS屏与语音交互
礼仪与书信
Dreame智控S6评测:2799元配6英寸IPS屏与语音交互

IT之家 3 月 16 日消息,追觅现已在京东上架一款 Dreame 智能中控屏 S6,该机配备一块 6 英寸面板,主打智能语音交互功能,定价为 2799 元。该中控配备一块 6 英寸 AF 防指纹

热心网友
03.16
谷歌Android 14 Beta 2支持严格限制无障碍API调用
礼仪与书信
谷歌Android 14 Beta 2支持严格限制无障碍API调用

IT之家 3 月 13 日消息,科技媒体 Android Authority 今天发布博文,报道称在安卓 17 Beta 2 更新中,谷歌已启用更严格的高级保护模式,直接拦截非最新无障碍工具类应用调

热心网友
03.13
微信新功能可忽略通话:社恐福音,拒接不显示
业界动态
微信新功能可忽略通话:社恐福音,拒接不显示

3月13日消息,微信日前官宣三大新功能,其中语音 视频通话忽略功能,因能让用户体面回避不想接的来电、且对方不会收到拒接提示,被网友直呼“社恐福音”。该功能与跨语言沟通、通话防误触功能一同开启灰度放量

热心网友
03.13
理想AI眼镜Livis升级:新增佩戴检测与一气呵成开关功能
礼仪与书信
理想AI眼镜Livis升级:新增佩戴检测与一气呵成开关功能

IT之家 3 月 10 日消息,AI 理想同学的最新账号今日宣布,理想 AI 眼镜 Livis 再进化,带来了佩戴检测 + 一气呵成两大开关、连续语音抓拍等功能。IT之家附理想 AI 眼镜 Livi

热心网友
03.11

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

SOL合约持仓量查询指南 如何查看SOL合约持仓数据与市场趋势
web3.0
SOL合约持仓量查询指南 如何查看SOL合约持仓数据与市场趋势

洞察市场先机:SOL合约持仓量深度解析与实战应用 在瞬息万变的加密货币衍生品市场,SOL合约持仓量如同一张实时绘制的“资金热力图”。它不仅揭示了多空双方投入的真实资本规模,更映射出市场情绪的微妙变化与潜在的趋势转折点。对于精明的交易者而言,掌握解读这张“地图”的能力,意味着能在市场博弈中抢占信息高地

热心网友
05.23
像素秘境唤灵师官网下载与正版安装地址获取指南
游戏攻略
像素秘境唤灵师官网下载与正版安装地址获取指南

《像素秘境·唤灵师》可通过九游APP或官网下载。在九游APP搜索游戏名即可预约并获取最新版,官网专区也提供高速与普通下载选项。两种方式均能便捷安装,专区还附有游戏攻略供参考。

热心网友
05.23
告别价格战中国车市迎来高质量发展新阶段
科技数码
告别价格战中国车市迎来高质量发展新阶段

车市价格战正处微妙临界点。二季度起,一股与以往降价潮不同的涨价暗流开始酝酿。截至五月中旬,至少15家主流新能源品牌已释放调价信号,或直接涨价,或收紧优惠,涉及比亚迪、特斯拉、蔚来等传统及新势力车企。

热心网友
05.23
上古卷轴5重制版奥杜因克星主线任务通关全攻略
游戏资讯
上古卷轴5重制版奥杜因克星主线任务通关全攻略

说起《上古卷轴5:重制版》的主线旅程,奥杜因克星任务绝对是一座绕不开的高峰。它不仅是叙事的关键转折点,更是一场对玩家策略、操作与耐心的综合试炼。想要征服这条恶龙,光有勇气可不够,一份清晰的行动路线图至关重要。接下来,我们就一起梳理一下这场终极对决的核心脉络与实用技巧。 一、剑指目标:前往奥杜因克星的

热心网友
05.23
SOL合约限价单最小价格单位详解与设置指南
web3.0
SOL合约限价单最小价格单位详解与设置指南

SOL合约限价单的最小价格单位是0 001美元。该单位是交易时报价的最小变动值,直接影响订单的精确性与灵活性。了解此规则对合约交易者有效设置订单和管理策略至关重要。

热心网友
05.23