首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
通义千问开源语音模型:省下近50%的GPU算力

通义千问开源语音模型:省下近50%的GPU算力

热心网友
99
转载
2025-12-24

12月24日消息,通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新模型融合高智商与高情商,具备出色的共情能力,对话如同与懂你的人聊天般自然。

在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等权威基准评测中,Fun-Audio-Chat-8B斩获SOTA成绩,超越同量级开源模型。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

目前,百聆家族成员已覆盖“会说话”的语音转文字模型Fun-ASR和“听得懂”的文字转语音模型Fun-CosyVoice3。

最新开源的模型Fun-Audio-Chat-8B主打语音对语种功能,实现了“能听会说”。

用户可与模型直接进行音频对话,适用于语音聊天、情感陪伴、智能设备和语音客服等多种场景。

即使没有任何情绪标签或提示词,它也能通过语义、语气、语速、停顿、重音等细微信号,感知对方的情绪状态,并给出恰到好处的关切、安慰或鼓励式回应。

此外,用户还能尝试角色扮演,量身定制语音的情绪、说话风格、语速、高低音和音量等。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

而模型之所以能保持“原有智商”,主要得益于两项创新的音频模型训练模式。

一是采用Core-Cocktail两阶段训练策略。先快速学习新本事,再将“新本事”和“老底子”融合起来。为了避免在掌握新技能时遗忘原有能力(灾难性遗忘),第一阶段训练得到的模型会与原始纯文本大模型的参数先行合并,再进行微调。

二是与人类偏好对齐。通过多阶段、多任务的后训练设计,模型能更好地理解真实对话场景中用户的语音内容与情绪线索,从而做出更自然、更符合人类期待的回应。

值得注意的是,新模型通过压缩→自回归→解压缩的双分辨率的端到端设计,将音频帧率降到业界最低的5Hz,在保证语音质量的同时节省近50% GPU计算资源。

节省近50%GPU计算!通义百聆开源新一代语音交互模型

目前,用户可在魔搭社区、Hugging Face和GitHub下载模型自行体验。

来源:https://m.mydrivers.com/newsview/1094368.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
黄仁勋谈GPU保值秘诀 五年前显卡为何越用越值钱
业界动态
黄仁勋谈GPU保值秘诀 五年前显卡为何越用越值钱

随着人工智能技术进入高速发展期,全球对算力的需求呈现爆发式增长。在众多算力资源中,GPU(图形处理器)已成为最核心且最紧缺的硬件。市场热度持续攀升,甚至带动了多年前发布的旧型号GPU价格逆势上涨,形成了一股罕见的市场风潮。 近日,英伟达(NVIDIA)首席执行官黄仁勋对这一现象给出了一个生动的比喻—

热心网友
05.14
港中文AI导演系统:聊天生成多镜头电影,单GPU打造好莱坞级视频
AI
港中文AI导演系统:聊天生成多镜头电影,单GPU打造好莱坞级视频

这项由香港中文大学多媒体实验室、快手科技以及香港创新科技研究院联合开展的研究,已于2026年3月发表在计算机视觉顶级会议上,论文编号为arXiv:2603 25746v1。对技术细节感兴趣的读者,可以据此查阅完整论文。 当前的AI视频生成技术,更像是一位只会使用固定机位的摄影师。它能产出精美的单帧画

热心网友
05.14
英伟达黄仁勋谈GPU保值:五年前显卡如陈年老酒越用越值钱
科技数码
英伟达黄仁勋谈GPU保值:五年前显卡如陈年老酒越用越值钱

AI需求爆发导致GPU严重短缺,连四五年前的旧款芯片价格也持续上涨。英伟达CEO黄仁勋将此现象比作“好酒效应”,形容GPU价格随时间不降反升。全球AI数据中心高度依赖GPU算力,供需失衡推高了全产业链价格。旧款GPU需求强劲,升值速度甚至超过真正陈年佳酿,反映出市场对算力资源的极度渴求。

热心网友
05.14
AI GPU计时芯片问世:GPU利用率提升至40%以上,时间误差降低100倍
科技数码
AI GPU计时芯片问世:GPU利用率提升至40%以上,时间误差降低100倍

AI数据中心正面临一个隐秘的效率瓶颈:时钟同步难题。你可能不知道,当前大规模AI集群中,GPU的实际利用率普遍仅为20%到40%,大量昂贵的算力资源,实际上都消耗在了等待时钟同步的空转周期上。 问题的核心在于分布式协同计算。AI训练与推理负载需要成千上万的GPU在极其严格的时间窗口内保持步调一致。即

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14