游乐游手机版
首页/科技数码/文章详情

阿里通义百灵开源FunAudio对话模型,支持8B语音生成

时间:2025-12-24 18:43
通义百聆系列近日推出全新开源语音交互模型Fun-Audio-Chat-8B,标志着其在语音对话领域迈入新阶段。该模型在智能理解与情感表达方面表现突出,能够精准捕捉对话中的情绪变化,实现自然流畅、富有

通义百聆系列近日推出全新开源语音交互模型Fun-Audio-Chat-8B,标志着其在语音对话领域迈入新阶段。该模型在智能理解与情感表达方面表现突出,能够精准捕捉对话中的情绪变化,实现自然流畅、富有共情的语音交流体验,让用户在互动中感受到如与知心之人对话般的亲切感。

在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU及SpeechFunctionCall等多个权威语音评测基准中,Fun-Audio-Chat-8B均取得了当前最佳性能,整体表现优于同规模其他开源模型。

目前,百聆系列已构建起完整的语音能力矩阵:涵盖支持语音转文字的Fun-ASR模型和实现高质量文本转语音的Fun-CosyVoice3。最新发布的Fun-Audio-Chat-8B进一步拓展功能边界,具备“能听会说”的端到端语音对语音交互能力,适用于语音聊天、情感陪伴、智能终端设备以及语音客服等多样化应用场景。

该模型可在无任何显式情绪标注或提示词输入的情况下,自主通过语义内容、语调起伏、语速节奏、停顿间隔和重音分布等细微语音特征,识别对方情绪状态,并据此输出具有温度度的回应,如适时的安慰、鼓励或关切表达。

同时,用户可根据需求自定义角色设定,灵活调整语音的情绪倾向、表达风格、语速节奏、音高变化和音量大小,打造个性化的语音交互体验。模型在持续优化表达能力的同时,有效保留了原有的语言理解水平,这得益于两项关键技术路径的创新设计。

其一是Core-Cocktail两阶段训练策略:首先让模型快速掌握语音交互新技能,随后将新习得的能力与原有文本大模型的知识基础进行参数融合,并开展联合微调,从而避免因学习新任务而导致原有能力退化的问题,即防止灾难性遗忘。

其二则是强化与人类对话偏好的对齐机制。通过多阶段、多任务的后训练架构,模型在真实对话环境中能更准确地理解语音输入中的语义信息与情绪线索,生成更加自然、贴合人类期待的回应内容。

值得一提的是,Fun-Audio-Chat-8B采用压缩-自回归-解压缩的双分辨率端到端框架,将音频处理帧率降至行业最低的5Hz,在显著降低计算负载的同时保持优异语音还原质量,GPU计算资源消耗减少近一半。

目前,该模型已向公众开放,用户可通过主流开源平台获取并本地部署体验。

来源:https://ai.zol.com.cn/1105/11053507.html
上一篇刘德华献唱华为大作《致敬非凡大师》,致敬极致精神 下一篇微信iOS 8.0.67更新:修复多项已知问题,提升稳定性
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个