上海市网信办近日更新了生成式人工智能服务备案名单,其中智元公司的WITA(硅光动语)大模型完成备案,成为国内首款合规的具身智能交互大模型。这一重要进展,标志着人形机器人在实现自然、拟人化交互的道路上迈出了关键一步,为相关行业应用铺平了道路。

那么,这款“硅光动语”大模型究竟有何独特优势?其核心目标在于为机器人赋予真正的“人格感”,彻底改变传统人机交互生硬、断续的体验。WITA大模型致力于将机器人升级为具备连续感知与情感交互能力的“硅基伙伴”。其应用场景清晰聚焦于导览、导购、导引及服务零售站等解决方案,成为驱动“交互智能部署”的核心引擎。
更值得期待的是,智元公司已规划了清晰的技术演进路线。据悉,公司计划于今年第三季度推出行业首个机器人原生的端到端全模态交互大模型——WITA Omni 1.0。该模型旨在将交互延迟压缩至500毫秒以内,这一响应速度已接近真人对话节奏。这意味着,未来与机器人的交流将告别“一问一答”的等待模式,实现正常语速下的连续自然对话。用户甚至可以中途插话、打断或纠正,机器人的情绪与语气也能实时呼应,交互自然度将获得质的飞跃。
除了响应速度,交互的“协调性”也将实现重大突破。WITA Omni 1.0强调多模态协同,确保语言、语音、表情和动作不再是割裂的信号,而是能像人类一样协调统一地表达情感与意图。此外,模型引入了“多模态交互数据飞轮”机制,使其能在真实场景部署中持续学习、不断进化,真正做到越用越智能。
在商业愿景层面,智元公司展示了宏大的发展蓝图。在不久前的首届香港具身智能产业峰会上,公司联合创始人、总裁兼CTO彭志辉正式发布了“智元358宏图计划”。该计划设定了清晰的营收目标:预计到2027年实现超100亿元营收,并展望在2030年突破1000亿元大关。这充分彰显了智元在具身智能赛道深耕并引领行业发展的坚定决心。

