1月20日消息,近期,MiniMax在港交所成功上市,其与声网也进一步深化了战略合作关系。MiniMax将凭借其领先的文本转语音(TTS)技术及多模态大模型,与声网先进的对话式AI引擎以及全球超低延迟实时传输网络(SD-RTN)相结合。这一强强联手将为全球开发者与企业提供强大支持,助力部署更具生命力、响应更灵敏、体验更拟人化的对话式AI产品。

早在2024年10月,声网便宣布与MiniMax携手,发布了国内首个Realtime API。这一合作旨在助力AI告别“机械感”,实现更低延迟的自然交流体验。
从模型能力到真实世界的交互
随着生成式AI的飞速发展,行业真正的挑战已转变为如何将高质量的AI能力,转化为跨设备、跨复杂网络环境的自然实时交互体验。

MiniMax的TTS模型具备表达丰富、可控且情感细腻的语音生成能力,支持多种语言、语调和说话风格。而声网则提供了互补的核心优势:将AI输出转化为实时交互体验,这使得AI的表现更贴近人类的沟通模式。
此次合作的独特之处不仅在于技术层面的集成,更在于双方全球化的视野:
MiniMax带来具备全球视野的前沿AI模型:其模型在设计之初便针对多语言、多文化及内容丰富的应用场景进行了优化。
声网提供经受住实战检验的全球实时网络:其自建的SD-RTN™网络覆盖200多个国家和地区,旨在提供毫秒级的超低延迟、出色的抖动控制以及大规模并发下的音视频质量保证。
双方共同填补了AI生态系统中的关键空白:即无论用户身处何地、使用何种设备,都能获得稳定、自然且富有表现力的AI语音交互体验。
赋能下一代实时语音AI产品
声网与MiniMax的联合解决方案已在多个场景中落地,包括:
· AI陪伴与智能设备:需要实时语音反馈的交互场景
· 实时语音Agents:用于客服和企业工作流的自动化交互
· 互动教育与内容平台:对自然语音质量和全球覆盖能力有极高要求的应用
· 多模态AI应用:语音需要与视觉、情感及动作保持高度同步的复杂场景
声网与MiniMax为开发者提供了一个从文本生成到实时语音交付的完整、端到端对话式AI基础设施底座。随着AI从云端走向日常交互的每一个瞬间,双方将持续为开发者和企业提供强有力的支持。
未来,双方计划在实时语音智能体、AI原生设备以及多模态对话体验等领域进一步扩大合作。
