游乐游手机版
首页/业界动态/文章详情

通义千问开源语音模型:省下近50%的GPU算力

时间:2025-12-24 11:30
12月24日消息,阿里通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。新模型兼具高智商和高情商,具备出色的共情能力,与之对话,仿佛与懂你的人聊天。在OpenAudioBen

12月24日消息,通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。

新模型融合高智商与高情商,具备出色的共情能力,对话如同与懂你的人聊天般自然。

在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等权威基准评测中,Fun-Audio-Chat-8B斩获SOTA成绩,超越同量级开源模型。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

目前,百聆家族成员已覆盖“会说话”的语音转文字模型Fun-ASR和“听得懂”的文字转语音模型Fun-CosyVoice3。

最新开源的模型Fun-Audio-Chat-8B主打语音对语种功能,实现了“能听会说”。

用户可与模型直接进行音频对话,适用于语音聊天、情感陪伴、智能设备和语音客服等多种场景。

即使没有任何情绪标签或提示词,它也能通过语义、语气、语速、停顿、重音等细微信号,感知对方的情绪状态,并给出恰到好处的关切、安慰或鼓励式回应。

此外,用户还能尝试角色扮演,量身定制语音的情绪、说话风格、语速、高低音和音量等。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

而模型之所以能保持“原有智商”,主要得益于两项创新的音频模型训练模式。

一是采用Core-Cocktail两阶段训练策略。先快速学习新本事,再将“新本事”和“老底子”融合起来。为了避免在掌握新技能时遗忘原有能力(灾难性遗忘),第一阶段训练得到的模型会与原始纯文本大模型的参数先行合并,再进行微调。

二是与人类偏好对齐。通过多阶段、多任务的后训练设计,模型能更好地理解真实对话场景中用户的语音内容与情绪线索,从而做出更自然、更符合人类期待的回应。

值得注意的是,新模型通过压缩→自回归→解压缩的双分辨率的端到端设计,将音频帧率降到业界最低的5Hz,在保证语音质量的同时节省近50% GPU计算资源。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

目前,用户可在魔搭社区、Hugging Face和GitHub下载模型自行体验。

来源:https://m.mydrivers.com/newsview/1094368.html
上一篇吴千语单场直播带货1.5亿,小红书诞生新一姐 下一篇章泽天晒网球照:坚持运动40天,活力状态分享
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
西伯利亚获评中国FPS游戏耳机领导品牌 权威背书引领行业
业界动态 · 2026-07-01

西伯利亚获评中国FPS游戏耳机领导品牌 权威背书引领行业

首先来看一个最新动态:在FPS电竞耳机赛道中,又一位实力“老将”获得了国家级权威认可。深耕游戏外设领域长达14年的西伯利亚,近日正式被新华社旗下头豹研究院授予“中国FPS游戏耳机领导品牌”称号,并得到新华社中国名牌的媒体支持。这一来自国家级媒体的背书,不仅是一份极高的荣誉,更是对其技术积累与市场表现

三星Z Fold 8双层超薄玻璃技术打造无折痕
业界动态 · 2026-07-01

三星Z Fold 8双层超薄玻璃技术打造无折痕

苹果那款据说倾注了全部心血的折叠屏iPhone还没正式亮相,三星这边已经明显感受到了压力。来自韩媒的消息显示,三星很可能会在下一代Galaxy Z Fold 8的显示屏上下两层都采用超薄玻璃(UTG)——这么做,能把那条让人头疼的折痕减少至少20%,无限逼近“完全无痕”的效果。其实在刚结束的CES

AI芯片技术双轨演进从通用架构到领域专用并行
业界动态 · 2026-07-01

AI芯片技术双轨演进从通用架构到领域专用并行

指令集优化与电路级重构协同塑造智能计算新生态 【导语】先说几个核心判断:2026年AI芯片的演进,其实是在两个完全不同的技术层次上同时发生的。一方面,AI算法正从实验室走向大规模工程化,另一方面,计算负载本身呈现出“算力需求激增”与“应用形态高度分化”并存的奇特局面。传统通用处理器的老路,在性能功耗

OpenAI无线耳机搭载三星2纳米Exynos芯片 自研Titan年底问世
业界动态 · 2026-07-01

OpenAI无线耳机搭载三星2纳米Exynos芯片 自研Titan年底问世

OpenAI最近动作频频,目标已经非常明确:围绕其AI订阅服务,打造一个庞大的硬件生态系统,把用户牢牢锁定在自家闭环里。从GPT级别的AI模型、专用AI芯片,到一系列消费级设备,这个版图正在迅速铺开。先说耳机。据最新爆料,OpenAI正在研发一款内部代号Sweetpea的专用人工智能耳机。虽然具体细

闪极科技AI眼镜主打佩戴体验 开启智能实用新时代
业界动态 · 2026-07-01

闪极科技AI眼镜主打佩戴体验 开启智能实用新时代

2025年,AI眼镜赛道持续升温,各大厂商纷纷入局。在这场智能穿戴的浪潮中,闪极科技的动作尤为引人瞩目——一口气推出loomos AI拍摄眼镜L1与AI显示眼镜S1两大系列,精准瞄准行业痛点。这一次,闪极并未在传统的“墨镜+摄像头”路线上小修小补,而是从佩戴结构与底层逻辑入手,进行了一次系统性重塑。