IT之家1月15日消息,据阶跃星辰最新微信公众号消息,阶跃星辰开源模型Step-Audio-R1.1,拿下全球第一。

阶跃星辰称,全球知名权威大模型评测榜单Artificial Analysis Speech Reasoning更新,阶跃星辰原生语音推理模型Step-Audio-R1.1登顶榜首。该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的能力,主要考察维度包括准确率、首包延迟等。
阶跃星辰表示,和大语言模型同理,语音模型同样需要具备强大推理能力,才能提供更高阶智能、更自然交互。Step-Audio-R1.1以96.4%准确率,超越Grok、Gemini、GPT-Realtime等主流一线模型,刷新历史最好成绩。在性能与速度的综合权衡上,Step-Audio-R1.1全面碾压同类语音模型。

据IT之家了解,Step-Audio-R1是由阶跃星辰发布的全球首个开源原生语音推理模型。它可以在不增加额外时延的情况下,端到端理解语音内容,“像人类一样听到对话即可思考”。
核心能力包括:
深度语音推理实时响应能力音频领域的可扩展CoT
Step-Audio-R1.1是最新升级版本,兼顾更强实时对话和复杂语音推理能力。完整的实时语音API将在2月上线,目前开放的chat模式已搭载R1.1核心,支持边想边说的流式推理。
