近期,新加坡国家人工智能计划与阿里巴巴展开合作,共同研发并发布了名为Qwen-SEA-LION-v4的东南亚多语言大模型。这一模型以阿里巴巴"通义千问"开源模型为技术基础,专为适应该地区复杂多元的语言环境而精心打造。
东南亚地区语言生态极其丰富,涵盖超过1200种语言,日常生活中多种语言混合使用的情况十分常见。然而,当前全球主流AI模型大多以英语为核心训练语言,难以有效满足当地市场的实际需求,导致本土人工智能发展面临严峻挑战。Qwen-SEA-LION-v4的推出,正是为了填补这一"AI鸿沟",为东南亚地区提供更贴近实际应用场景的语言处理工具。
在"东南亚语言模型全面评估基准"(SEA-HELM)的开源模型榜单(参数量2000亿以下)中,这款中新合作研发的模型表现突出,成功登顶榜首。这一成就不仅印证了其技术实力,也彰显了双方合作取得的显著成效。
为更好地适应东南亚语言特点,Qwen3模型在预训练阶段就纳入了119种语言,为理解当地小语种奠定了坚实基础。通义千问团队还在后续训练中加大了跨语言任务的权重,使模型能够更从容地应对现实世界中多语言混合输入的复杂场景。
目前,Qwen-SEA-LION-v4模型已通过新加坡AI计划官方平台和HuggingFace开源社区向全球用户开放免费下载,为不同地区和场景的语言处理需求提供了新的解决方案。
